- 相關(guān)推薦
百度面試問(wèn)題:百度機器翻譯獲獎你知道嗎?
小度機器人是如何具有這樣一流的多語(yǔ)言翻譯水平呢? 這得益于百度領(lǐng)先的翻譯技術(shù),將機器翻譯與語(yǔ)音識別完美結合,讓小度掌握了多語(yǔ)種翻譯的強大技能。在本次中國電子學(xué)會(huì )科學(xué)技術(shù)獎項評選中,百度牽頭與中科院自動(dòng)化所、浙江大學(xué)、哈爾濱工業(yè)大學(xué)、中科院計算所、清華大學(xué)研發(fā)的《基于大數據的互聯(lián)網(wǎng)機器翻譯核心技術(shù)及產(chǎn)業(yè)化》項目獲得科技進(jìn)步獎一等獎。該項目在海量翻譯知識獲取、翻譯模型、多語(yǔ)種翻譯技術(shù)等方面取得重大突破,解決了傳統方法研發(fā)成本高、周期長(cháng)、質(zhì)量低的難題,獲得了包括國際機器翻譯協(xié)會(huì )主席、《Machine Translation》主編Andy Way,美國計算機協(xié)會(huì )智能系統和技術(shù)處理匯刊創(chuàng )辦主編楊強,電氣電子工程師學(xué)會(huì )兼美國計算機協(xié)會(huì )音頻、語(yǔ)音及語(yǔ)言處理匯刊主編李海洲等多位在人工智能、計算機翻譯領(lǐng)域的海外知名學(xué)者的高度評價(jià)。
據了解,此次百度機器翻譯項目的獲獎主要在于突破了四個(gè)世界性難題:提出了創(chuàng )新的基于互聯(lián)網(wǎng)大數據的翻譯模型,實(shí)時(shí)準確地響應多文體、多領(lǐng)域的復雜翻譯請求;研發(fā)了基于互聯(lián)網(wǎng)大數據的海量高質(zhì)翻譯知識獲取技術(shù),制定了語(yǔ)言?xún)热萏幚淼膰H標準;提出了基于深度語(yǔ)義的語(yǔ)言分析和翻譯技術(shù),突破了機器翻譯中公認的消歧和調序等世界難題;提出了基于樞軸語(yǔ)言的翻譯技術(shù),使得資源稀缺的小語(yǔ)種翻譯成為可能,并實(shí)現了多語(yǔ)種翻譯的快速部署。
這款由百度推出的小度機器人在深度問(wèn)答方面已經(jīng)小有名氣。去年江蘇衛視《芝麻開(kāi)門(mén)》的答題闖關(guān)類(lèi)節目里,小度機器人就憑借迅速的反應和準確的回答勇闖四關(guān),答對全部40道涉及音樂(lè )、影視、歷史、文學(xué)等領(lǐng)域的題目,出色的表現贏(yíng)得現場(chǎng)觀(guān)眾陣陣驚嘆。這次它的再次亮相帶來(lái)了全新的功能——多語(yǔ)種即時(shí)翻譯,不管現場(chǎng)主持人和嘉賓怎么給它制造翻譯難度,無(wú)論是說(shuō)中文、英語(yǔ)還是日語(yǔ)、韓語(yǔ),小度機器人都能從容應對、準確翻譯,儼然一個(gè)精通各國語(yǔ)言的“翻譯小達人”,很多現場(chǎng)嘉賓表示“真想帶著(zhù)它去旅游” 。
破除語(yǔ)言壁壘是互聯(lián)網(wǎng)時(shí)代的用戶(hù)“剛需”
早在計算機誕生之初的1947年,科學(xué)家就提出了機器翻譯的設想,美國、歐盟、日本和我國都投入巨資開(kāi)展這一技術(shù)的研發(fā)。近年來(lái),隨著(zhù)多語(yǔ)言網(wǎng) 頁(yè)信息的快速膨脹和互聯(lián)網(wǎng)網(wǎng)民數量的激增,網(wǎng)民滲透率達到73%以上的翻譯用戶(hù)也在同步增長(cháng),破除語(yǔ)言壁壘實(shí)現無(wú)障礙的信息獲取和交流,已經(jīng)成為廣大網(wǎng)民 的“剛需”,互聯(lián)網(wǎng)機器翻譯也越來(lái)越得到各國政府和產(chǎn)業(yè)界的重視。
“搜索的本質(zhì)就是連接人與信息、人與服務(wù)。在尋找信息和服務(wù)的過(guò)程中,人們會(huì )有用其它語(yǔ)言表達需求的時(shí)候,也會(huì )有看其它語(yǔ)言結果的需求。為了更 好地把人和多語(yǔ)言的信息和服務(wù)連接起來(lái),我們需要翻譯。“ 王海峰表示,百度翻譯已經(jīng)支持16種語(yǔ)言、186個(gè)翻譯方向,涵蓋了包括中文、英文、日語(yǔ)、韓語(yǔ)、法語(yǔ)、俄語(yǔ)等主要語(yǔ)種,每天響應上億次的用戶(hù)請求。
為了進(jìn)一步滿(mǎn)足用戶(hù)需要,百度翻譯先后推出了語(yǔ)音翻譯、實(shí)物翻譯、涂抹翻譯、離線(xiàn)翻譯等亮點(diǎn)功能。將強大的機器翻譯技術(shù)和語(yǔ)音識別、語(yǔ)音合成、圖像識別、文字識別等完美結合,取得了絕佳的用戶(hù)體驗。
互聯(lián)網(wǎng)大數據驅動(dòng)機器翻譯技術(shù)新突破
當然,機器翻譯的發(fā)展并非一帆風(fēng)順。“第二代機器翻譯之所以遇到瓶頸,在于其難以突破語(yǔ)言理解的技術(shù)屏障”,中國工程院院士倪光南在現場(chǎng)演講中 表示,“大數據和互聯(lián)網(wǎng)給出了一個(gè)新的工具和解決辦法”,通過(guò)發(fā)揮大數據的威力實(shí)現了技術(shù)突破,“我相信我們在這些領(lǐng)域做好,可以通過(guò)機器翻譯促進(jìn)機器智 能的發(fā)展。”
“百度翻譯在基于大數據的翻譯模型、翻譯知識獲取、樞軸語(yǔ)言翻譯等方面取得了重大技術(shù)突破”,王海峰指出,在互聯(lián)網(wǎng)大數據的翻譯模型指導下,無(wú) 論是跨語(yǔ)言聊天、還是閱讀外語(yǔ)專(zhuān)業(yè)文獻,百度翻譯云平臺都可以與相應算法充分融合,實(shí)時(shí)響應每天來(lái)自全球超過(guò)上億次復雜多樣的翻譯請求;基于在互聯(lián)網(wǎng)大數 據方面的多年積累,研發(fā)出高質(zhì)量翻譯知識獲取技術(shù),突破了傳統翻譯在知識獲取方面的小規模、高成本瓶頸,使機器翻譯的知識準確率超過(guò)90%。除此之外,這 個(gè)項目成果還在翻譯消歧、調序、語(yǔ)種覆蓋等難題上提出創(chuàng )新的解決方案,讓基于深度語(yǔ)義、樞軸語(yǔ)言等的翻譯技術(shù)持續提升機器翻譯的準確率和翻譯更多語(yǔ)言的可 能。
倪光南院士也對百度機器翻譯技術(shù)的給出了極高評價(jià),倪院士把大數據比作“第四種科學(xué)范式“,稱(chēng)其為”一個(gè)強大的工具”。“正是由于處于大數據時(shí)代,我們才能將現在的機器翻譯提到一個(gè)全新的高度,百度在這方面在世界當中占有重要的地位。”
【百度面試問(wèn)題:百度機器翻譯獲獎你知道嗎?】相關(guān)文章:
百度機器翻譯獲獎 全球47億人因此受益07-21
百度面試07-25
2016最熱面試問(wèn)題:百度機器翻譯獲國家科技進(jìn)步二等獎07-21
都在做百度SEO 你是否對百度有了解03-30
百度笑話(huà)07-05
百度校園招聘完整面試經(jīng)歷12-08
百度筆試題及答案02-09