- 相關(guān)推薦
專(zhuān)訪(fǎng)百度IDL林元慶:百度大腦如何在人臉識別上戰勝人類(lèi)
機器在一些能力上超過(guò)人是很正常的,比如我們之前也發(fā)明了汽車(chē),汽車(chē)肯定跑得比人快。但人工智想要整體全面地超越人類(lèi)還有非常長(cháng)的路要走,現在還只是做了一些非常小的事情,離智能機器的威脅還非常遠。
2017 年 1 月 6 日,百度首席科學(xué)家吳恩達帶著(zhù)小度機器人來(lái)到了《最強大腦》現場(chǎng),與人類(lèi)選手展開(kāi)了對決,并在人臉識別比賽里以 3:2 的比分贏(yíng)得勝利。Master 事件引發(fā)大眾熱議人工智能的余熱未退,小度機器人又在跨年齡人臉識別挑戰中戰勝了本屆最強大腦隊長(cháng)王峰——擁有數個(gè)世界冠軍頭銜的「世界記憶大師」。與以往主要考驗空間搜索能力的人機 PK 不同,此次比拼主要集中在識別領(lǐng)域,而識別過(guò)程中需要模糊推理的能力,百度深度學(xué)習實(shí)驗室(IDL)主任林元慶坦言,這場(chǎng)應戰也并不輕松。
對于此次比賽任務(wù),百度 IDL 人臉團隊主要是使用了「度量學(xué)習」,即通過(guò)學(xué)習一個(gè)非線(xiàn)性投影函數把圖像空間投影到特征空間中。在這個(gè)特征空間里,跨年齡的同一個(gè)人的兩張人臉的距離會(huì )比不同人的相似年齡的兩張人臉的距離要小。同時(shí)考慮到跨年齡人臉數據的稀缺性,百度大腦使用了一個(gè)用大規模人臉數據訓練好的模型作為「底座」,然后用跨年齡數據對它做更新。這樣不容易過(guò)擬合。然后再將這兩點(diǎn)結合起來(lái)做端到端的訓練,從而大幅度地提升了小度跨年齡人臉識別的識別率。
從這期節目開(kāi)始,機器之心將通過(guò)訪(fǎng)談視頻「AI Talk」持續為大家解讀百度參加最強大腦比賽的多項技術(shù)原理,還原 IDL 籌備比賽的細節故事。
下面是機器之心對百度深度學(xué)習實(shí)驗室(IDL)主任林元慶獨家專(zhuān)訪(fǎng)完整版文字:
機器之心:請簡(jiǎn)單介紹一下人臉識別。
林元慶:人臉識別簡(jiǎn)單說(shuō)就是給你一張人臉的照片,然后我希望能識別照片里面是哪一個(gè)人。
人臉識別其實(shí)有兩種技術(shù)。
一種技術(shù)我們經(jīng)常叫 1:1 的人臉比對,比如像銀行的應用場(chǎng)景,就是你給一個(gè)身份證信息,然后再給一張人臉,通過(guò)比對希望知道這張人臉是不是身份證上面的那個(gè)人。系統會(huì )拿這個(gè)身份證的信息給到公安的系統里面取一張照片回來(lái),然后跟你現在的照片比對看是不是同一個(gè)人。
還有一種更通用的 1:N 人臉識別,N 可以是幾千、幾萬(wàn)或者幾十萬(wàn)進(jìn)行比對,這叫 1:N 的比對或者是 1:N 的人臉識別。
機器之心:機器是通過(guò)哪些特征進(jìn)行人臉識別的?
林元慶:深度學(xué)習還沒(méi)有特別流行起來(lái)之前,一般會(huì )設計一些特征對人臉進(jìn)行識別,F在用深度學(xué)習的方法其實(shí)是一層一層的去學(xué)不同的特征,底層會(huì )是非常低級別的特征,越往上會(huì )學(xué)到一些非常高級別的特征。像我們的系統應該是千萬(wàn)到億的低級別特征,慢慢一層一層學(xué)上去,最后那一層其實(shí)只有 128 個(gè)特征。
機器之心:在不同的應用場(chǎng)景中,機器學(xué)習算法如何決定人臉特征點(diǎn)的的數目?
林元慶:像我們現在做的方法,在不同的應用場(chǎng)景里面其實(shí)特征數目是確定的,只是可能會(huì )是不同的特征。特征數目的大小是由深度學(xué)習的架構決定的。一旦我們把神經(jīng)網(wǎng)絡(luò )的架構確定下來(lái),這個(gè)數目就是固定的。我們只是根據不同的場(chǎng)景(不同的場(chǎng)景意思就是不同的訓練數據)訓練出來(lái)的特征可能是很不一樣的。因此在不同的場(chǎng)景里面特征數目可能是一樣的,但具體特征會(huì )是很不一樣的。
機器之心:比賽中,小度機器人能將少年時(shí)期和中年時(shí)期的人臉識別出來(lái),如果是將年齡擴大拉長(cháng),嬰兒和老人的照片是否可以識別和匹配出來(lái)?
林元慶:跨年齡識別是非常難的。就我們現在的系統,年齡跨度在 20 到 30 歲的時(shí)候我們仍然能做到比較高的精度。當我們把這個(gè)跨度進(jìn)一步增加到 50 歲或 60 歲的話(huà),難度肯定也會(huì )進(jìn)一步增加,精度會(huì )下降。我們還沒(méi)有很仔細地做過(guò)這么大年齡跨度的實(shí)驗。這是我們下一步要做的事情。
機器之心:介紹一下跨年齡人臉識別使用的度量學(xué)習?
林元慶:我們這次去參加《最強大腦》的這套系統,使用的其實(shí)是基于深度學(xué)習的端到端的度量學(xué)習方法 (Metric Learning)。這個(gè)方法通過(guò)學(xué)習一個(gè)非線(xiàn)性映射函數(用深度神經(jīng)網(wǎng)絡(luò )模型),把圖像空間投影到一個(gè) 128 維的特征空間中。深度學(xué)習要實(shí)現的是,對于同一個(gè)人的兩張照片,不管年齡差距有多大,它們映射到這 128 唯特征空間的兩個(gè)點(diǎn)(即兩個(gè) 128 維的向量)要離得很近;對于不同人的兩張照片,它們映射到這 128 唯特征空間的兩個(gè)點(diǎn)要離得足夠遠 – 即使他們年齡相近。當這個(gè)映射函數學(xué)習好之后,看兩張照片是否是同一個(gè)人變得簡(jiǎn)單:把他們映射到這個(gè) 128 維的空間了,如果映射到的兩個(gè)點(diǎn)離得近,那這兩張照片就是同一個(gè)人,否則就是不同人。因此核心是如何訓練這個(gè)用深度神經(jīng)網(wǎng)絡(luò )建模的映射函數,即通過(guò)調整深度神經(jīng)網(wǎng)絡(luò )的參數。我們用大規模人臉數據訓練出深度神經(jīng)網(wǎng)絡(luò )模型,實(shí)現高識別率。
機器之心:百度通過(guò)非線(xiàn)性投影函數進(jìn)行映射減少訓練損失,那么這個(gè)非線(xiàn)性投影函數是如何得出來(lái)的,是通過(guò)訓練集得出來(lái)的嗎?
林元慶:定義度量學(xué)習的目標函數之后,我們是通過(guò)梯度下降法來(lái)進(jìn)行訓練,慢慢把目標函數給降下來(lái)。梯度下降法是很通用的做法。這里面很重要的是要定義度量學(xué)習的目標函數,然后要定義深度神經(jīng)網(wǎng)絡(luò )的架構,最后通過(guò)訓練實(shí)現目標函數的逐漸優(yōu)化。
機器之心:人臉識別業(yè)務(wù)的核心問(wèn)題是人臉關(guān)鍵特征點(diǎn)的定位,錯誤的特征定位會(huì )導致提取的人臉描述特征嚴重變形,進(jìn)而導致識別性能下降,百度是如何解決這個(gè)問(wèn)題的?
林元慶:其實(shí)是兩個(gè)方面。一個(gè)方面是我們要想辦法去做出非常好的特征點(diǎn)定位的算法,然后要訓練非常好的模型。在一些極端的情況下,得到的特征點(diǎn)定位可能不準確,因此我們希望后面的識別模塊有一定的容錯能力。我們是在訓練的時(shí)候制造一些數據,在定位上人為地產(chǎn)生一些誤差,然后拿這些數據放在深度神經(jīng)網(wǎng)絡(luò )里面一起去參加訓練,這樣的話(huà)最后訓出來(lái)的模型對定位的誤差會(huì )有一定的容錯能力。
機器之心:百度大腦的這種能力的培養使用了多少的訓練樣本?訓練了多長(cháng)時(shí)間?
林元慶:我們的訓練其實(shí)是分兩部分,最重要的一部分叫通用的人臉識別的能力,就是百度這幾年來(lái)一直在積累搭建的技術(shù),到比賽為止我們大概用了 200 萬(wàn)人的 2 億張照片進(jìn)行人臉識別基礎模型訓練。
另一方面,為了這次比賽,我們也收集了一些跨年齡的數據,根據跨年齡這個(gè)場(chǎng)景再進(jìn)一步優(yōu)化模型,跨年齡數據大概在幾千張這個(gè)級別,并不算特別的多。
機器之心:角度、表情、光線(xiàn)、陰影化妝、和配飾等會(huì )在多大程度上影響人臉識別準確率?
林元慶:我們主要是針對人臉角度在 45 度之內的應用場(chǎng)景,因此我們的訓練模型基本上在 45 度之內識別的還是比較準確的。在這個(gè)范圍之內,角度影響不會(huì )特別大。但是在大于 45 度之后精度就會(huì )開(kāi)始下降。如果是 90 度,特別是當我們沒(méi)辦法檢測到五官的時(shí)候,精度就會(huì )下降比較嚴重,比如說(shuō)一邊眼睛看不到的情況下下降會(huì )比較嚴重。
化妝肯定會(huì )有影響,但如果只是很局部的化妝其實(shí)還好。像美瞳只是造成一個(gè)局部被改變,人臉整體基本上變化不是那么大。這些其實(shí)我們的算法都能夠比較好的處理。整形整容就很難,屬于比較大的改變,識別難度就比較大。
機器之心:小度機器人是通過(guò)安裝的攝像頭直接觀(guān)察還是接入圖像信號?
林元慶:在錄制的現場(chǎng),節目組會(huì )在選手前面的顯示屏上給出一路信號,同樣的信號也給到小度這邊。我們的系統得到的信號和選手肉眼可以看到的信號是一樣的。
機器之心:小度機器人分析處理是在本地完成還是在云端?此次使用的計算資源情況如何?
林元慶:訓練都是在云端。云端我們有非常多、非常大的一個(gè)計算集群來(lái)專(zhuān)門(mén)做剛才提到的 200 萬(wàn)人的 2 億張照片的訓練。但真正訓練完之后,計算是在本地完成的,我們在本地只用了一個(gè) GPU。
實(shí)際上,我們希望我們的人臉識別技術(shù)能夠廣泛應用到各個(gè)領(lǐng)域,甚至是讓很多人在手機上就可以用到這一功能。因此,我們希望在訓練的時(shí)候用非常多的計算機,但是真正應用時(shí)的計算量不要太大。
機器之心:節目中,人類(lèi)選手在介紹判斷方法時(shí)也提到選取一些人臉特征,是否意味著(zhù)這方面機器和人類(lèi)的識別原理類(lèi)似,就像 CNN 從某種程度上來(lái)說(shuō)是借鑒了人類(lèi)的視覺(jué)原理一樣?
林元慶:從廣義上來(lái)說(shuō)肯定都是通過(guò)特征來(lái)識別,但是區別在于提取的是什么特征。深度學(xué)習系統其實(shí)是從海量的數據里學(xué)一些共同特征,對共性的特征也更加敏感。但是人其實(shí)不僅僅會(huì )用共性的特征,還會(huì )用一些很特別的特征。舉個(gè)例子,假如說(shuō)一個(gè)人的鼻子上有一顆痣,目前我們的這個(gè)系統是不會(huì )學(xué)出來(lái)的,因為它在我們數據庫里的兩百萬(wàn)人身上不常見(jiàn),它就會(huì )把這個(gè)特征忽略掉,但人去識別的時(shí)候,他會(huì )把這顆痣變成一個(gè)非常重要的特征去跟蹤。
CNN 架構毫無(wú)疑問(wèn)在相當程度上都是模仿人的視覺(jué)系統。和人的視覺(jué)系統類(lèi)似,CNN 有很多層,然后一層層進(jìn)行非線(xiàn)性映射,從非常低級別的特征一層層映射上去,最后生成一個(gè)非常高級別的有分辨能力的特征。
機器之心:作為機器學(xué)習和計算機視覺(jué)領(lǐng)域的專(zhuān)家,你認為一家公司在人臉識別技術(shù)方面足夠領(lǐng)先的標準是什么?
林元慶:關(guān)鍵在于看技術(shù)能力的強大與否,具體還要看三個(gè)層次。第一個(gè)是算法層次,大家通常會(huì )選擇在一些通用和公開(kāi)的測試集上進(jìn)行測試,看這套算法究竟有多強。但這種方法也是有局限性的,公開(kāi)測試集的樣本量可能比較小,所以你在這種測試集上的表現做得很好,并不代表你在實(shí)際問(wèn)題上也能做得很好。因此,在百度內部,我們會(huì )搭建的一些規模很大的測試集。我們通常的做法是,在我們算法研發(fā)的過(guò)程中,我們會(huì )在這些大測試集上去測。如果要和別人比的話(huà),我們會(huì )在公開(kāi)的測試集上進(jìn)行測試。
下一個(gè)層面是技術(shù)層面。其實(shí)技術(shù)不單單是算法,它需要的是算法加數據。前面我們提到的公開(kāi)測試集,它等于假設說(shuō)我們不需要去管數據了。而實(shí)際上非常重要的是算法要跟數據一起發(fā)展。人臉的數據就是這樣的例子。我們有兩百萬(wàn)人的人臉,有的算法可能沒(méi)辦法在這上面應用,因為你需要非常長(cháng)的時(shí)間去訓練。并且有些算法可能不能完全利用大數據里面的一些特點(diǎn)。所以,算法和技術(shù)一定要一起發(fā)展的。
最后一個(gè)層面是應用層面。非常重要的是研發(fā)出一些技術(shù),并在實(shí)際問(wèn)題的解決上擁有較高的精度。這既是技術(shù)是否滿(mǎn)足實(shí)際應用的重要指標,更是檢驗人工智能技術(shù)最重要的一個(gè)指標。不同公司的技術(shù)有多好在于他們能解決多少實(shí)際的問(wèn)題。特別是對于人工智能而言,被應用的廣度和深度就是衡量一項人工智能技術(shù)是否強大的一個(gè)重要指標。
所以總的來(lái)說(shuō)就是算法、技術(shù)和應用三個(gè)層面。我們希望能夠研發(fā)出非常好的技術(shù)和算法來(lái)滿(mǎn)足更多實(shí)際場(chǎng)景應用的需要。人工智能領(lǐng)域里的很多技術(shù)是需要不斷增長(cháng)的數據去訓練,從而不斷提高模型精準度的。大應用是非常重要的一環(huán)。所以,即便你的公司搭建了一套非常好的基礎技術(shù),但如果你背后沒(méi)有大的應用給你形成閉環(huán)的話(huà),這個(gè)技術(shù)也很難往前發(fā)展。拿圖像識別來(lái)說(shuō),它需要算法加數據,然后再將這項技術(shù)應用。有了應用,用戶(hù)會(huì )給你提交更多數據,這又會(huì )幫你訓練出更好的模型。然后你就有了更好的技術(shù)。這是一個(gè)正循環(huán),直到把技術(shù)發(fā)展到極致。因此大應用是非常重要的。對人工智能來(lái)說(shuō),研發(fā)一項技術(shù)要短期做到極致是不太可能的,一定是要有很好的應用場(chǎng)景能夠迭代起來(lái),最后才能把技術(shù)做到極致。
機器之心:接下來(lái),百度會(huì )將人臉識別這項技術(shù)重點(diǎn)應用于哪些領(lǐng)域?
林元慶:我們這次決定去參加人機 PK,最重要的出發(fā)點(diǎn)就是希望看看百度通過(guò)這幾年的研發(fā)積累,我們的人工智能水平跟最頂尖的人類(lèi)相比處于哪一個(gè)水平上。節目組跟我們定的「圖片識別」和「聲音識別」兩個(gè)方向,我們也非常喜歡。其實(shí)之前有很多次人機 PK 的比賽,最早的「深藍」,后來(lái)的 Watson 在《危險邊緣》節目上的比賽,還有最近的 AlphaGo,這些更多是在比這一步棋我該怎么走、下一步該怎么走,或是去尋找答案,和這次 PK 有較大區別。這次應該是人類(lèi)歷史上第一次在圖像和聲音的識別能力上跟人進(jìn)行高水平 PK。
之所以我們會(huì )對這兩個(gè)技術(shù)特別感興趣,是因為這兩個(gè)技術(shù)有非常多應用,實(shí)用性很強。人臉識別的應用領(lǐng)域中很重要的一個(gè)場(chǎng)景是互聯(lián)網(wǎng)金融的身份認證。百度有一個(gè)金融事業(yè)部,他們的主營(yíng)業(yè)務(wù)就是互聯(lián)網(wǎng)金融,已經(jīng)用到我們的人臉識別技術(shù)。我們認為要做好互聯(lián)網(wǎng)金融,身份認證是第一件你必須做的非常好的事情,你一定要知道在計算機或手機前面的那個(gè)人到底是誰(shuí),身份認證甚至可以說(shuō)是互聯(lián)網(wǎng)金融的第一步。我們也希望以后這項技術(shù)不單單用在百度,也可以用到更多的金融公司里面。
另一個(gè)很重要的應用是人臉識別可以用在門(mén)禁系統中,百度大廈現在就使用了人臉閘機。是去年在互聯(lián)網(wǎng)大會(huì )時(shí),我們在烏鎮落地了一個(gè)人臉識別的閘機,之前景區使用的是指紋認證系統,在烏鎮參觀(guān)游玩的游客會(huì )需要多次進(jìn)入,需要身份認證。如果每一次要進(jìn)出的時(shí)間過(guò)長(cháng),非常影響用戶(hù)的體驗,甚至要排很長(cháng)的隊。在這樣的場(chǎng)景下,人臉識別系統跟指紋系統相比,有相當大的優(yōu)勢,烏鎮現在用這種 1:N 的認證,游客走到附近就被識別出來(lái),馬上可以通暢進(jìn)出。為什么這些原來(lái)沒(méi)有,其實(shí)也是因為最近百度在人臉識別上有非常好的技術(shù)突破,今年我們真正實(shí)現了高精度 1:N 的人臉識別,我們現在外面公布的是能做到 99% 以上的精度,這應該在國內是首創(chuàng )。
機器之心:首期節目之后,我們還有哪些收獲?
林元慶:我們希望百度的人臉識別以后能有更多的人來(lái)用起來(lái)。之前更多的是應用在互聯(lián)網(wǎng)上,比如打開(kāi)百度的圖片搜索,搜「劉德華」會(huì )出來(lái)很多劉德華的照片,里面就使用了人臉識別,因為照片庫里既會(huì )有劉德華也會(huì )有梁朝偉,系統需要通過(guò)人臉識別知道哪一張照片是劉德華哪一張是梁朝偉。這背后其實(shí)是我們做了全網(wǎng)的明星人臉的索引,這是之前我們人臉識別一個(gè)非常重要的用處,但后面我們希望能讓人臉識別用在更廣的地方,給大家的生活帶來(lái)更多便利。
機器之心:細粒度視覺(jué)分類(lèi)(FGVC/Fine-Grained Visual Categorization)是今年 CVPR 的熱門(mén)研究方向,可否分享一下 IDL 在人臉細粒度識別的研究方面有何進(jìn)展?
林元慶:細粒度圖像識別其實(shí)跟通常我們說(shuō)的圖像識別有不太一樣的地方,比如我們普通的識別可能只需要知道這是一只狗、一只貓、一個(gè)桌子,但細粒度圖像識別,就要明確這一只貓是哪一個(gè)品種、這個(gè)桌子是哪個(gè)廠(chǎng)家哪個(gè)型號的。
舉個(gè)例子,百度有一個(gè)非常瘋狂的項目是菜品識別,我們希望能實(shí)現這樣的場(chǎng)景:你在餐館里拍一張菜品照片就能識別它是哪一個(gè)餐館的哪一道菜,你能想象其中的難度會(huì )非常大。這里面用到的很多技術(shù)跟普通的圖片識別也有很大區別。更多方面的信息需要通過(guò)算法去估計。比如,對于鳥(niǎo)類(lèi)識別,可能得粗略的知道這是鳥(niǎo)的頭部,這是鳥(niǎo)的尾巴,鳥(niǎo)頭部是長(cháng)這個(gè)樣子,等等。從學(xué)術(shù)上來(lái)講,我們稱(chēng)之為注意力模型,F在百度在這方面做了很多研發(fā)工作。
我們最近在 CVPR 提交了一篇文章,我們充分利用位置信息自動(dòng)地去學(xué)習物體位置信息和位置上的特征信息,最后得到非常高的識別精度。在幾個(gè)公開(kāi)的測試集上,我們的表現應該都是業(yè)界最好的。同時(shí),我們也把這項技術(shù)用到百度的產(chǎn)品里。在去年的烏鎮互聯(lián)網(wǎng)大會(huì )上,我們結合百度糯米在景區里的 18 家餐館應用了菜品識別的功能,實(shí)現了我之前描述的場(chǎng)景。烏鎮只是一個(gè)起點(diǎn),我們現在其實(shí)早期能覆蓋大概 4000 家國內餐館,然后希望能一步一步地覆蓋到國內上大部分的餐館。
機器之心:菜品識別這個(gè)應用,實(shí)現大規模推廣所面臨的挑戰是什么?
林元慶:從難度上講,基本上有兩個(gè)方面。一個(gè)是數據,我們需要收集足夠多的數據來(lái)訓練模型,這就需要跟百度糯米等產(chǎn)品端配合才能去各個(gè)餐館里收集數據,而全國餐館數量是百萬(wàn)級別的,我們要訓練的模型的類(lèi)別會(huì )是幾千萬(wàn)或上億類(lèi)別。二是技術(shù)方面。這里,我們的技術(shù)跟普通普通識別的差別在于我們要能夠處理千萬(wàn)個(gè)類(lèi)別,還要處理非常小的類(lèi)間區別和非常大的類(lèi)內區別。比如,麻婆豆腐長(cháng)得都很像,不同餐館的麻婆豆腐只有非常細微差別,然而從不同角度,用不同光線(xiàn)拍的即使同一個(gè)餐館的麻婆豆腐也會(huì )很不一樣。因此,對于識別來(lái)說(shuō),這就是很難的問(wèn)題。通常大家也會(huì )把人臉識別當成一個(gè)非常特殊的細粒度圖像識別的例子,我們不單單要識別照片里有人臉,還要識別出是哪個(gè)人的人臉。
機器之心:要實(shí)現李彥宏所說(shuō)的「讓百度大腦像人類(lèi)大腦」這個(gè)目標,接下來(lái)人工智能是不是也應該從人腦和神經(jīng)科學(xué)中獲得更多線(xiàn)索和靈感?
林元慶:在最強大腦比賽現場(chǎng),對于一個(gè)識別對象,我們的系統只看到的一張或者是幾張這個(gè)人的照片,然后去做比對。從一定程度上來(lái)說(shuō),我們用的是遷移學(xué)習(transfer learning),這在一定程度上跟人很類(lèi)似。平?戳撕芏嗟娜,人慢慢學(xué)會(huì )了辯臉的能力,機器也一樣,在這個(gè)能力上有很強的通用性。從更長(cháng)遠來(lái)看,在推理方面,人比機器要強很多,機器還需要從人腦機理等各個(gè)方面再去學(xué)習,設計出更好的算法,希望機器能夠跟人一樣思考推理。
機器之心:通過(guò)《最強大腦》這類(lèi)面向大眾的節目,百度希望傳遞關(guān)于人工智能的哪些理念?
林元慶:我們參與這次活動(dòng)很重要的一個(gè)目的是希望能讓大眾能深切感覺(jué)到人工智能能做什么。我們配合節目播出的同時(shí)也會(huì )把我們辯臉技術(shù)做成 App 開(kāi)放出來(lái),大家可以上傳照片直接去體驗一下。我們希望通過(guò)節目讓大眾深刻體驗到人工智能技術(shù),這對人工智能技術(shù)的推廣有非常好的作用。像 AlphaGo,他們做得非常棒的一個(gè)事情就是一下子讓很多人都知道人工智能,之前可能還只是停留在行業(yè)內。這其實(shí)非常重要,因為后面的人工智能能夠做得非常好,需要大眾的這種接受度,他們覺(jué)得這些技術(shù)真的很有價(jià)值、愿意使用這些技術(shù)才是整個(gè)行業(yè)發(fā)展至關(guān)重要的一步。
機器之心:這次在節目的現場(chǎng)比拼中,百度大腦擊敗了頂級選手,您認為這有什么樣的意義?
林元慶:我其實(shí)不太同意用「擊敗」這個(gè)詞。這次我們和最強大腦選手比賽,在人臉識別這個(gè)特定任務(wù)上,我們證明了通過(guò)海量數據、深度學(xué)習算法,機器學(xué)習系統能夠學(xué)到非常強的人臉識別的能力。目前這方面我們做的水平還不錯,但人類(lèi)除此之外還有非常多的能力。另一方面,其實(shí)也等于說(shuō)驗證了我們在這條路上探出了非常有效的研發(fā)路徑,后面我們可以把類(lèi)似的經(jīng)驗應用到更多更廣的范圍。人工智能在很多方面仍然并不強于人類(lèi),從研發(fā)角度來(lái)講,我們希望我們的技術(shù)能越來(lái)越強大,能做的事情越來(lái)越多。
機器之心:在機器越來(lái)越智能的今天,我們應該如何對待人類(lèi)與機器之間的關(guān)系?
林元慶:其實(shí),機器在一些能力上超過(guò)人是很正常的,比如我們之前也發(fā)明了汽車(chē),汽車(chē)肯定跑得比人快。但人工智想要整體全面地超越人類(lèi)還有非常長(cháng)的路要走,現在還只是做了一些非常小的事情,離智能機器的威脅還非常遠。對這個(gè)行業(yè)里面的研究人員來(lái)說(shuō),我們還有很多的事情要做,這條路還很長(cháng)。
【專(zhuān)訪(fǎng)百度IDL林元慶:百度大腦如何在人臉識別上戰勝人類(lèi)】相關(guān)文章:
專(zhuān)訪(fǎng)百度IDL林元慶:我們就這樣贏(yíng)了最強大腦03-23
百度李彥宏:百度金融要用互聯(lián)網(wǎng)追趕華爾街03-17
李彥宏:創(chuàng )業(yè)應該去做百度看不上的業(yè)務(wù)03-26
李彥宏:創(chuàng )業(yè)公司應該去做百度看不上的業(yè)務(wù)11-24
李彥宏 百度CEO的人生軌跡03-27