- 相關(guān)推薦
專(zhuān)訪(fǎng)百度IDL負責人林元慶:告別蹣跚 AI大幕已啟
人工智能不是單個(gè)技術(shù),而是包含很多很多的不同技術(shù),以計算機視覺(jué)為例,它就有圖像分類(lèi),物體檢測,圖像分割等不同技術(shù)。
近日,在有韓國“硅谷”之稱(chēng)的韓國大田,IROS 2016正在如火如荼地舉行,在Special論壇的人工智能/深度學(xué)習專(zhuān)場(chǎng),百度深度學(xué)習實(shí)驗室(IDL)主任林元慶做了《AI,the (next) big thing》(《人工智能:大幕已啟》)的主題演講,作為計算機視覺(jué)和機器學(xué)習領(lǐng)域非;钴S的一名成員,現百度IDL負責人,目前他領(lǐng)導的IDL正進(jìn)行著(zhù)PaddlePaddle深度學(xué)習開(kāi)源框架、圖片搜索、基礎圖像識別技術(shù)、人臉識別、OCR(光學(xué)字符識別)、視頻分析、學(xué)習機器人、細粒度圖像識別、AR以及醫療影像分析等十多個(gè)研究方向。雷鋒網(wǎng)在演講過(guò)后采訪(fǎng)了林元慶,請他講了關(guān)于IROS,關(guān)于開(kāi)源平臺,關(guān)于A(yíng)I眼下最重要一步的看法。以下是采訪(fǎng)全文。
雷鋒網(wǎng):此行來(lái)IROS的目的?
IROS是世界上最大的關(guān)于Robitics的國際會(huì )議之一,大會(huì )的Plenary talk是會(huì )議眾多演講的重中之重。雖然平時(shí)我很少在外面公開(kāi)做演講,但這樣一個(gè)學(xué)術(shù)性的talk既然主動(dòng)邀請,就過(guò)來(lái)了,另外這也是向世界的Robotics研究人員介紹百度人工智能的好機會(huì )。
雷鋒網(wǎng):作為一個(gè)機器人會(huì )議中受邀的AI演講者,機器人中需要用到AI的地方,可以概括一下?
很多,像我剛剛說(shuō)的百度大腦里面,有語(yǔ)音識別,計算機視覺(jué),NLP,推薦/預測,運動(dòng)/控制,決策/規劃,這幾個(gè)AI大方向都是機器人學(xué)的重要基礎技術(shù)。
雷鋒網(wǎng):CPU+FPGA,CPU+GPU組合更看好哪個(gè)?百度不同業(yè)務(wù)去分配的時(shí)候是如何決定用哪個(gè)組合的?
這兩個(gè)技術(shù)都在進(jìn)步,我們沒(méi)有一個(gè)預設的立場(chǎng),百度這兩個(gè)方向都在應用。選擇上,百度不同業(yè)務(wù),訓練階段大部分用的大部分是GPU,testing階段有用GPU,也有用FPGA的,更成熟的業(yè)務(wù)可能會(huì )選擇FPGA,這樣優(yōu)化的空間會(huì )更大一些。
(看你剛剛放的PPT劃分的百度AI相關(guān)業(yè)務(wù),這些業(yè)務(wù)用哪個(gè)組合會(huì )有明確的選擇嗎?)
這個(gè)很難講,人工智能不是單個(gè)技術(shù),而是包含很多很多的不同技術(shù),以計算機視覺(jué)為例,它就有圖像分類(lèi),物體檢測,圖像分割等不同技術(shù)。GPU和FPGA對不同的任務(wù),可能各有優(yōu)缺點(diǎn)。
(就是一項業(yè)務(wù)訓練的時(shí)候用的GPU,實(shí)際應用的時(shí)候可能轉到FPGA?)
對,是這樣。
雷鋒網(wǎng):現在ImageNet比賽結果對工業(yè)界的意義在哪里?
這幾年ImageNet的競賽涌現出一些非常有用的算法,比如AlexNet之后的GoogleNet, VGG, ResNet等,對工業(yè)界的技術(shù)性能的提高,有很大的推動(dòng)作用。ImageNet一個(gè)很大的意義是在于推動(dòng)算法的革新。這對工業(yè)界和學(xué)術(shù)界,都是非常有意義的。
同時(shí),工業(yè)界打造的產(chǎn)品,常常需要go beyond ImageNet。我記得第一年(2010年)ImageNet比賽我們拿了第一名。我是當時(shí)項目的負責人。但之后我們發(fā)現ImageNet的結果很難直接用在產(chǎn)品上。我們后來(lái)開(kāi)始主攻細粒度圖像識別。百度糯米這個(gè)月下旬將推出一個(gè)非常重要的功能,其中的一個(gè)重要技術(shù)就是菜品圖像的細粒度識別(識別圖片里的菜品是哪個(gè)餐館的哪道菜)。即使是通用的圖像分類(lèi),百度的圖像庫有接近1億張帶類(lèi)別標簽的圖片,比ImageNet Challenge(150萬(wàn)張圖片)的大很多。我們內部的數據要比公開(kāi)的數據大很多,需要更好地反應我們要解決的問(wèn)題。
雷鋒網(wǎng)(公眾號:雷鋒網(wǎng)):你現在領(lǐng)導的十個(gè)業(yè)務(wù)都跟之前主攻方向之一大規模細粒度圖像識別有何關(guān)系?
對,有很多關(guān)聯(lián)的。最直接的當然是細粒度圖像識別方向。我們希望在百度搭建一個(gè)非常強大的細粒度圖像識別的研發(fā)團隊。其它的項目與這也有關(guān)聯(lián)。比如人臉識別就是一個(gè)最經(jīng)典的細粒度圖像識別任務(wù)。很多技術(shù)是相通的。還比如我們的醫學(xué)圖像分析,它的很多做法與細粒度圖像識別也有相通之處。
我們現在強調做instance-level的細粒度圖像識別。比如,我們身下坐的這把椅子,我們不單單只是識別這是一把椅子,我們還需要識別出這是哪個(gè)廠(chǎng)家哪個(gè)型號的椅子。還比如前面提到的“哪個(gè)餐館哪道菜”的識別。這些都是非常精細的識別。這些問(wèn)題當然都很難,需要投入很大的研發(fā)力量。但應用前景是非常大的。
雷鋒網(wǎng):跟之前NEC的工作有什么內在聯(lián)系?
NEC美國實(shí)驗室在美國是非常優(yōu)秀的實(shí)驗室,也在A(yíng)I上做了非常多的工作。我也非常幸運地在那里做了7年半的研究,包括最后三年多作為實(shí)驗室媒體分析部門(mén)的負責人。當時(shí)的工作與現在的工作一脈相承。
雷鋒網(wǎng):剛在演講最后,你講到AI大幕已啟,接下來(lái)讓它走地更遠的話(huà),最重要的一步是什么?
最重要的一步是要有用,能解決實(shí)際問(wèn)題,真正能解決一些很重要的問(wèn)題。比如自動(dòng)駕駛,那就是要真正能上路。人臉識別,就是什么情況下人臉識別都能識別得非常精準。
雷鋒網(wǎng):作為過(guò)來(lái)人分享一下,學(xué)生選Robotics專(zhuān)業(yè)的時(shí)候要注意什么?
機器人,包括AI,大家可能會(huì )有一些誤解,覺(jué)得這是單一技術(shù),但其實(shí)它涵蓋的技術(shù)非常復雜,而一個(gè)人是很難去解決所有的技術(shù)的。像今天第一個(gè)talk講的機器手抓取,從應用角度來(lái)看這是一個(gè)非常特定的領(lǐng)域,但這個(gè)方向做學(xué)問(wèn)的話(huà)你都可以做很久。
我個(gè)人的傾向是注意不要大而全,要根據自身的興趣和特長(cháng)定一些側重點(diǎn)。我經(jīng)常會(huì )跟我身邊的人說(shuō),要認準一個(gè)方向,做到這個(gè)方向的Mr. something,比如Mr. fine-grained image recognition。這樣你的事業(yè)可能就越走越寬。
雷鋒網(wǎng):作為一個(gè)AI參與者,前不久余凱發(fā)了一個(gè)聲明:“一直以來(lái)我非常欽佩谷歌的Jeff Dean在MapReduce和谷歌大腦(TensorFlow)等項目上的杰出成就。但是,我必須指出,放任TensorFlow成為世界上占統治地位的人工智能開(kāi)發(fā)平臺對世界是危險的。……” 如何看這個(gè)觀(guān)點(diǎn)?
AI的平臺很重要,確實(shí)需要多樣化的選擇,上次我也回了他朋友圈,認為我們這一代人應該團結起來(lái),推動(dòng)深度學(xué)習平臺的開(kāi)放和多樣化。百度現在有PaddlePaddle深度學(xué)習平臺,這個(gè)其實(shí)是百度花了非常大的資源做的一個(gè)平臺,現在開(kāi)源了,希望能在中國人工智能領(lǐng)域貢獻一些我們的力量。
雷鋒網(wǎng):之前PC時(shí)代,Windows出現了就有Mac OS,還有Linux; 移動(dòng)互聯(lián)網(wǎng)時(shí)代,iOS出現了就有Android;從來(lái)沒(méi)有一家獨大的時(shí)候,會(huì )不會(huì )AI平臺也不用擔心?
還是不太一樣。很多AI技術(shù)有一個(gè)正循環(huán)效應,越多的人來(lái)用,你的系統越好,這樣會(huì )吸引越多的人來(lái)用。你已經(jīng)快速迭代了甚至已經(jīng)做到極致了,別人再去重新開(kāi)始一個(gè),難度是比較高的。
小結:
林元慶在演講的過(guò)程中,以及會(huì )后采訪(fǎng)的過(guò)程中,一直在強調AI大幕“已經(jīng)啟動(dòng)”這個(gè)關(guān)鍵動(dòng)作,雖然“人工智能”這個(gè)概念最早從1955年8月31日就開(kāi)始提出,但從當時(shí)的誕生,到中間的兩起兩落,一直像個(gè)蹣跚學(xué)步的孩子一樣經(jīng)歷了60年才迎來(lái)了第三次復興的浪潮。
1956年到1974年,全球第一次人工智能浪潮出現。
1974年到1980年。第一次人工智能冬天出現。
80年代出現了人工智能數學(xué)模型方面的重大發(fā)明,第二次浪潮出現。
1987年到1993年現代PC的出現,讓人工智能的寒冬再次降臨。
不過(guò)這一次,隨著(zhù)硬件,數據,算法三板斧的默契配合和發(fā)展,AlphaGo與世界頂級圍棋高手李世石的人機世紀對戰,人工智能已經(jīng)從基本的語(yǔ)音識別,圖像識別,向著(zhù)自動(dòng)駕駛,視頻,AR,醫療,金融等各種領(lǐng)域無(wú)聲地滲透,也引發(fā)了全民關(guān)注AI復興的熱潮。
老驥伏櫪,志在千里。如果說(shuō)過(guò)去60年是它從孕育到躊躇的“蹣跚”周期,那往后60年,將會(huì )是它揭開(kāi)“無(wú)窮大”大幕的周期。
【專(zhuān)訪(fǎng)百度IDL負責人林元慶:告別蹣跚 AI大幕已啟】相關(guān)文章:
專(zhuān)訪(fǎng)百度IDL林元慶:我們就這樣贏(yíng)了最強大腦03-23
專(zhuān)訪(fǎng)李開(kāi)復:AI時(shí)代互聯(lián)網(wǎng)巨頭將繼續壟斷03-03
專(zhuān)訪(fǎng)AlphaGo之父:AI是全人類(lèi)的,不應由幾家公司獨占02-27
專(zhuān)訪(fǎng)李開(kāi)復:十年后50%工作將被AI取代03-27
500元起家估值已超百億11-17
專(zhuān)訪(fǎng)曹德安:日產(chǎn)2000箱,年銷(xiāo)300萬(wàn)元02-27
于剛專(zhuān)訪(fǎng)02-25
王健林專(zhuān)訪(fǎng)02-28