當(dāng)前位置:中工網(wǎng)理論頻道科教天地-正文
計算機學(xué)會思考(圖)
//8858151.com2014-02-25來源:天津日報
分享到:更多

  

  使用海量數(shù)據(jù)來識別照片和語音并實時翻譯講話,深度學(xué)習(xí)計算機朝著真正的人工邁進(jìn)了一大步。英國《自然》雜志近日就此進(jìn)行了報道。

  深度學(xué)習(xí)東山再起

  2012年,位于美國加州山景城的神秘莫測的Google X實驗室的研究人員用1000臺計算機(共有1.6萬個處理器)構(gòu)建出了全球最大的電子模擬神經(jīng)網(wǎng)絡(luò)——擁有10億個連接的人工神經(jīng)網(wǎng)絡(luò)“谷歌大腦”,并通過向其展示自YouTube視頻中提取出的約1000萬張靜止的圖像,考察其能學(xué)到什么。結(jié)果顯示,在無外界指令的自發(fā)條件下,該人工神經(jīng)網(wǎng)絡(luò)自主學(xué)會了識別人臉、人體甚至貓等類別的事物。

  也許這看起來只是瑣碎的成就,除了表明貓的主人們熱衷于上傳寵物視頻,導(dǎo)致互聯(lián)網(wǎng)上貓的視頻隨處可見之外,說明不了更多問題,因此,這一發(fā)現(xiàn)也讓記者們訕笑不已。但實際上,該成果是深度學(xué)習(xí)東山再起的一個里程碑。

  這一進(jìn)步也意味著,谷歌在人工智能領(lǐng)域又達(dá)到了一個新的高度,在業(yè)界引發(fā)廣泛關(guān)注。對電腦用戶而言,人工智能研究一直前景廣闊,但迄今成果寥寥,不過情況慢慢發(fā)生了變化。在過去幾年內(nèi),包括谷歌、蘋果和IBM等在內(nèi)的互聯(lián)網(wǎng)巨擘們一直在積極爭奪在深度學(xué)習(xí)方面擁有專業(yè)技術(shù)的初創(chuàng)公司和研究人員。

  對每個消費者來說,深度學(xué)習(xí)計算機的顯著進(jìn)步所帶來的好處包括:軟件能更好地對照片進(jìn)行篩查、理解語音指令并將對文本進(jìn)行翻譯。而對科學(xué)家和醫(yī)學(xué)界人士而言,深度學(xué)習(xí)計算機能用來篩查藥物,標(biāo)示出大腦內(nèi)真實的神經(jīng)網(wǎng)絡(luò)并預(yù)測蛋白質(zhì)的功能。

  “人工智能研究領(lǐng)域遇到的挫敗可謂不可勝數(shù),但也取得了稍許進(jìn)步,或許,未來的研究會一馬平川!鄙疃葘W(xué)習(xí)專家、美國紐約大學(xué)數(shù)據(jù)科學(xué)中心的主任楊樂康(音譯)表示。

  “接下來的幾年內(nèi),很多人會投入深度學(xué)習(xí)的洪流當(dāng)中!泵绹又荽髮W(xué)伯克利分校的計算機圖像識別專家吉騰德拉·馬利克也認(rèn)同這一觀點。

  讓機器學(xué)會思考和做決定

  在解釋深度學(xué)習(xí)之前,我們需要了解什么是機器學(xué)習(xí)。機器學(xué)習(xí)是人工智能的一個分支,而在很多時候,幾乎成為人工智能的代名詞。簡單來說,機器學(xué)習(xí)就是通過算法,使得機器能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對新的樣本做智能識別或?qū)ξ磥碜鲱A(yù)測。機器學(xué)習(xí)的發(fā)展大致經(jīng)歷了兩次浪潮:淺層學(xué)習(xí)和深度學(xué)習(xí)。

  深度學(xué)習(xí)這一技術(shù)已有30年的歷史了。深度學(xué)習(xí)旨在模仿人腦的神經(jīng)網(wǎng)絡(luò),其作用就如人類大腦里掌管知覺、運動指令、意識、語言的“新皮層”,它能自己學(xué)習(xí)辨識聲音、圖像和其他數(shù)據(jù),從而幫助計算機破解一些人類幾乎完全依靠直覺來解決的瑣碎問題,從識別人臉到理解語言等。

  深度學(xué)習(xí)本身也源于一個更古老的計算理念:神經(jīng)網(wǎng)絡(luò)。這些神經(jīng)網(wǎng)絡(luò)系統(tǒng)模擬的是人腦內(nèi)神經(jīng)細(xì)胞之間的緊密關(guān)聯(lián)。這些神經(jīng)細(xì)胞可以彼此溝通,互相施加影響,當(dāng)把這樣一個神經(jīng)網(wǎng)絡(luò)暴露在數(shù)據(jù)面前,不同神經(jīng)細(xì)胞之間的關(guān)系會發(fā)生改變。這樣,網(wǎng)絡(luò)就會發(fā)展出對某個類別的輸入數(shù)據(jù)作出特定反應(yīng)的能力。通過這種方式,網(wǎng)絡(luò)就擁有了學(xué)習(xí)能力,“學(xué)”到了一些東西。

  “谷歌大腦”大約有100萬個模擬神經(jīng)細(xì)胞,模擬了10億個連接,比此前的任何深度神經(jīng)網(wǎng)絡(luò)都要大10多倍。“谷歌大腦”項目的創(chuàng)辦人安德魯·恩格現(xiàn)在是美國斯坦福大學(xué)人工智能實驗室的主任,致力于使深度學(xué)習(xí)系統(tǒng)再擴(kuò)大10倍。

  發(fā)展歷程緩慢艱辛

  在上世紀(jì)50年代,計算機還是新興事物,那時,第一代人工智能研究人員就滿懷期望地預(yù)測,完全成熟的人工智能很快就會到來。但隨著人們慢慢認(rèn)識到客觀世界的極端復(fù)雜性,尤其是當(dāng)人們開始接觸到諸如人臉為什么是人臉而非一張面具或猴臉這樣的知覺或感性問題時,這種過于樂觀的想法才逐漸偃旗息鼓。

  到了上世紀(jì)80年代,這種更好的方式似乎是神經(jīng)網(wǎng)絡(luò)內(nèi)的深度學(xué)習(xí)。這樣的系統(tǒng)可以從頭開始學(xué)習(xí)規(guī)則,而且具有令人愉悅的對稱性——使用受到大腦啟發(fā)的機制來完成類似大腦的功能。在這一系統(tǒng)中,模擬的神經(jīng)細(xì)胞被組織成不同的層,當(dāng)向這樣的系統(tǒng)展示一副人臉的圖片時,第一層只是注意所有黑像素和亮像素;接下來的一層可能可以意識到這些像素會形成邊角;再下一層或許可以識別出橫線和豎線;最后一層或許可以認(rèn)出眼睛,能夠意識到兩只眼睛實際上出現(xiàn)在同一張臉上。

  其他競爭性的想法

  當(dāng)然,也并非所有科學(xué)家都看好深度學(xué)習(xí),他們正在嘗試使用其他方法來解決問題。比如,美國華盛頓大學(xué)計算機科學(xué)與工程系教授、艾倫人工智能研究所的負(fù)責(zé)人奧倫·埃齊奧尼的目標(biāo)是發(fā)明一臺計算機——當(dāng)給其“喂食”一堆經(jīng)過掃描的教科書后,其能通過標(biāo)準(zhǔn)化的小學(xué)科學(xué)測試(如果其不斷加強,最終能通過大學(xué)入學(xué)考試)。為了通過這些測試,這臺計算機必須能閱讀并理解圖表和文本。不過,艾倫人工智能研究所如何實現(xiàn)這一目標(biāo)還是一個未知數(shù)。但對埃齊奧尼來說,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)并非他們的首選。

  一個競爭性的想法是,讓計算機能在基本輸入事實上的基礎(chǔ)上進(jìn)行推理,而非從頭開始學(xué)習(xí)事實。因此,科學(xué)家們或許會為這種計算機編寫程序,讓其識別“所有的女孩都是人”這樣的論斷。接著,當(dāng)一篇提到一個女孩的文本被提交給這臺計算機時,計算機能推導(dǎo)出這個女孩是人。但這樣的計算機也有自己的問題,因為我們周圍的世界太紛繁復(fù)雜,即使沒有數(shù)百萬個,也有數(shù)十萬個這樣的事實。

  目前,在這方面表現(xiàn)最好的就是IBM公司的計算機沃森(Watson)。Watson運算更快,記憶力更好,它也懂一些人類語言中的暗喻和雙關(guān)。2011年,Watson在美國最受歡迎的智力競賽節(jié)目Jeopardy中戰(zhàn)勝人類,獲得冠軍,從而聲名大噪。盡管如此,IBM公司沃森解決方案實驗室的科學(xué)家們對深度學(xué)習(xí)在改進(jìn)模式識別方面的優(yōu)異表現(xiàn)也產(chǎn)生了興趣。

  谷歌也是如此,盡管其圖像標(biāo)記方面的最新進(jìn)展主要得益于辛頓的深度學(xué)習(xí)網(wǎng)絡(luò),但其他研發(fā)部門也得到了足夠多的關(guān)注。2012年12月,谷歌雇傭未來學(xué)家雷·庫茲韋爾做其工程部主管,庫茲韋爾的主要任務(wù)是使用但不局限于深度學(xué)習(xí)的技術(shù),來為計算機尋找不同的方式,讓其能從日常經(jīng)驗中學(xué)習(xí)。

  去年5月份,谷歌購買了一臺由加拿大D-Wave公司研制而成的量子計算機。盡管從理論上而言,這臺計算機能用于深度學(xué)習(xí)領(lǐng)域,但科學(xué)家們目前主要用其來處理非人工智能方面的任務(wù),比如困難的數(shù)學(xué)計算等。

  深度學(xué)習(xí)帶來了機器學(xué)習(xí)的一個新浪潮,受到從學(xué)術(shù)界到工業(yè)界的廣泛重視,也導(dǎo)致了“大數(shù)據(jù)+深度模型”時代的來臨。在應(yīng)用方面,深度學(xué)習(xí)使得語音圖像的智能識別和理解取得驚人進(jìn)展,從而推動人工智能和人機交互大踏步前進(jìn)。盡管如此,深度學(xué)習(xí)仍然還處于襁褓階段!八俏磥淼囊徊糠!钡鹿栒f,我們才剛剛開始。如果我們能在理論、建模和工程方面,突破深度學(xué)習(xí)技術(shù)面臨的一系列難題,人工智能的夢想將不再遙遠(yuǎn)。

  來源:《科技日報》

中 工 網(wǎng) 版 權(quán) 所 有 ,未 經(jīng) 書 面 授 權(quán) 禁 止 使 用
Copyright © 2008-2010 by 8858151.com. all rights reserved
瀏覽本網(wǎng)主頁,建議將電腦顯示屏的分辨率調(diào)為1024*768