AI開拓者Yann LeCun:深度網絡優雅又閃耀

AI開拓者Yann LeCun:深度網絡優雅又閃耀

大數據文摘出品

編譯:雪清、Jonykai、陳同學、蔣寶尚

20世紀80年代中期,Mullet髮型和粉紅格子夾克大行其道(譯者注:mullet髮型是一種文化現象),精力充沛的Richard Simmons剛剛掀起健身狂潮,而人工智能(AI)方面的研究卻幾乎陷於停滯狀態。

一方面,那時候計算機的計算能力還遠達不到要求。早期的軟盤驅動器在複雜程度上與現代的智能手機相比是小巫見大巫,計算機芯片在1989年以前也容納不了數百萬個組件,現今這個數字可以達到80億。

另一方面,一片揮之不去的陰霾使得關於人工智能的一切幻想難以變為現實。1984年,美國人工智能學會舉行了一次重大的會議,會議中該領域的先驅Marvin Minsky站出來警告商界:投資者對人工智能的熱情最終帶來的只會是失望。果不其然,人工智能投資開始逐步走向崩潰。

*Marvin Minsky:

http://web.media.mit.edu/~minsky/minskybiog.html

現在看來,像Yann LeCun這樣有遠見的人沒有持太多的悲觀主義是一件幸事。這位土生土長的法國人,在加入新澤西州AT&T貝爾實驗室的自適應系統研究部門時,甚至還不到30歲。

在那裡,他對人工智能的熱情日益高漲。

LeCun在貝爾實驗室研究出了許多新的機器學習方法,其中包括卷積神經網絡——由動物視覺皮質啟發的模型。並且他的工作也促進了圖像和視頻識別,以及自然語言處理的進步。

AI開拓者Yann LeCun:深度網絡優雅又閃耀

“20世紀60年代後期,人工智能背景下的統計學習方法就像被判了死刑”,LeCun回憶道。“人們或多或少地放棄了它。不過由於人們對神經網絡的興趣,它在80年代後期又重新回到了我們面前。當訓練多層神經網絡的學習算法在80年代中期出現時,統計學習方法曾掀起了一股熱潮。”

在敘說這場革命的過程中,LeCun顯得有點謙虛過頭了。他的發現創造了歷史,但他幾乎沒有提到過自己的名字或是成就。他拒絕把自己當回事;事實上他的個人網站上會有一整節全是雙關語俏皮話,其中有這樣的自我告誡:“反酷刑的日內瓦公約,以及反對殘酷和施暴行為的美國憲法,禁止我兇殘地連續使用三個以上雙關語。”

LeCun也拒絕止步於自己在計算機科學方面業已獲得的成就;如今,他擔任Facebook的首席AI科學家,不知疲倦地努力實現新的突破。現在,我們跟著他來享受一次特權之旅——零距離接觸這位學術明星——一起來探討人工智能的成長曆程,最新的變化以及它的潛力。

人工智能的開端——感知器觸碰學習的邊緣

LeCun熟知人工智能的發展歷程,對其中的里程碑事件以及重要的人物如數家珍。故事從1956年夏天在達特茅斯舉行的頭腦風暴會議開始,“人工智能”一詞即創造於此。

AI開拓者Yann LeCun:深度網絡優雅又閃耀

僅僅一年之後,Frank Rosenblatt在康奈爾航空實驗室發明了感知器。其早期的實現之一是Mark 1感知器,這是一臺龐大的矩形機器,包含400個光電池,它們被隨機地連接到簡單的圖案檢測器上,這些檢測器將被用於可訓練的分類器。

*Mark 1感知器:

http://www.dtic.mil/dtic/tr/fulltext/u2/236965.pdf

“這是首個能夠學會以一種非平凡的方式識別簡單圖案的神經網絡”,LeCun說。“你可以使用它們進行簡單的圖像識別,但它們不能識別出圖像中的物體,也不能用於任何推理或設計。”

一直到過去十年,模式識別系統都需要大量的手工作業來識別自然圖像中的物體。“你必須做很多工作以構建一個可以對圖像做出表述的工程模塊——這種表述通常是能被這些簡單的學習算法處理的一長串數字。因此,基本上你不得不手工完成這項工作。” 他補充說,早期的語音識別和機器翻譯也是類似的情況:手工操作意味著要付出更多的努力,但收穫甚微。

那麼,迄今為止,計算機科學究竟發生了什麼變化?“在所有這些應用中,深度學習和神經網絡已經帶來了顯著的性能提升——並且大大減少了之前必要的手工勞動”,LeCun說。“這使得人們可以將這些應用擴展到許多不同的領域。”

那麼問題來啦,計算機在一開始如何“學習”。

神經網絡就像是大腦的軟件模擬;它們處理諸如視覺圖像之類的信息並試圖得出正確的答案。但是,如果答案並不是很正確呢?這就要說到“反向傳播”了,它是一種讓神經網絡能夠學習的反饋流算法。

LeCun和反向傳播

1986年,反向傳播迎來了突破性的發現。當時,Geoffrey Hinton教授指出計算機可以通過反覆執行任務來學習,每次都讓神經網絡“向誤差減小的方向調整”,他也成為最早描述該方法的研究者之一。

AI開拓者Yann LeCun:深度網絡優雅又閃耀

LeCun不僅實現了Hinton的早期理論,他還幫助奠定了基礎。20世紀80年代早期,Hinton首先提出了“反向傳播”的觀點,但放棄了它,因為他認為它不起作用。

但在1985年,LeCun撰寫了一篇論文,描述了一種反向傳播的形式,正如他所說,“這是一個不起眼的會議。論文是用法語寫的,基本上沒有什麼人閱讀,但至少出現了一個重要的人。”而那個人就是Hinton。LeCun之後到了多倫多大學,在Hinton的指導下擔任博士後研究助理,再後來他開始在AT&T貝爾實驗室(晶體管的誕生地)工作。

“所有機器學習都是關於誤差矯正的”,LeCun解釋道。想象一下,向計算機展示“成千上萬的汽車和飛機圖像,每次參數自我調整一點,輸出就越接近正確的——如果你足夠幸運的話,最終會確定一個結構,這時每輛汽車和每架飛機都能被正確識別。”

當他描述最終結果時,LeCun的回答讓人敬畏:“學習的神奇之處在於,即使系統從未見過的圖像也會被正確分類。”

儘管如此,他還是免不了變得有點淘氣。“有各種各樣的技巧可以讓反向傳播起作用,它仍然是一種神秘魔法——但現在我們有了一個秘訣。如果你遵循這個秘訣,它每次都會奏效。”

數據,AI和商業:未來和侷限

AI開拓者Yann LeCun:深度網絡優雅又閃耀

人工智能時代的數據被喻為新黃金、新石油、新貨幣。是的,當今人人都知道:從審計到電子商務,數據對企業來說非常有價值。但是為了發揮出數據的作用,企業中的管理者就要區分數據能做什麼和不能做什麼。

LeCun認為:“對於用機器學習賦能業務,數據非常重要。你需要數據來訓練你的系統。擁有的數據越多,系統就越準確。因此,不管從技術目標還是業務角度來看,數據都是多多益善的。”

但使用一段時間,你就會發現數據成了油膩的培根:也就是說,它無法讓智能化的機器更加智能。

“無論是Facebook、Deep Mind、Google Brain還是其他機構的研究者,我們在研究人工智能時,都不使用內部數據來測試它們,”LeCun說道。“使用公共數據能夠將我們的方法與學術界其他人的進行比較。擁有更多數據對於開發更好的方法並不重要。實際上,我們使用盡可能少的數據量,來使模型達到很好的表現。”

在學術研究中尤其如此,其中關鍵角色不是要處理大量的數據,而是成為LeCun所說的“新思想的先鋒”。

“數據對於利用機器學習創造業務非常重要。你需要數據來訓練你的系統。擁有的數據越多,系統就越準確。”

——Yann LeCun

同時,構建人工智能戰略的企業需要在尋找解決方案之前進行自我評估。“這取決於AI對你的系統有多重要,”LeCun指出。“如果只想應用現有的AI方法,可以直接使用雲服務。那麼這樣會相對容易。”一些企業和出租技術可以幫助人工智能的部署。

最大的挑戰是那些希望建立自己的工程團隊的公司。LeCun說:“總體來說,現在對人工智能工程師和科學家們的需求很高,而人才很稀缺,所以你必須付高價來僱傭他們。”

兩種學習方式,一個光明的未來

AI開拓者Yann LeCun:深度網絡優雅又閃耀

LeCun概述了人工智能中兩種不同類型的學習:監督學習和無監督學習。監督學習適用於大部分機器學習的場景。利用監督學習,研究人員們訓練模型來更好地識別圖像或其他形式的輸入。比如你可以把它想象成旋鈕,通過自動調整,使機器的輸出更接近你想要的。

雖然無監督學習或“自我監督”的學習在當今機器學習中佔比很小,但卻擁有很大的潛力。LeCun說:“這種學習方法是從本質上預測我們在世界上所感知到的一切。

現在的情況似乎是,需要預測將要發生什麼才能獲得下一步的突破。但可以肯定的是,對於科學家、學術界和高科技巨頭來說,探索無監督學習的吸引力太大了。

這個研究的回報將能夠完成我們目前不能做的所有應用。所以,希望能擁有智能虛擬助理,同他們交談並理解你所說的一切。他們會切實地在日常生活中真正地幫助到你。

“這有點像電影《她》,你看過那部電影嗎?”

簡單介紹一下:這部電影在2013年由Spike Jonze執導,講的是Joaquin Phoenix扮演的一個孤獨作家,愛上了由Scarlett Johansson配音的虛擬助手。LeCun毫不掩蓋對它的喜愛之情。

AI開拓者Yann LeCun:深度網絡優雅又閃耀

《她》電影海報

“這部影片描繪了人工智能成熟後,人們和他們的虛擬助手之間可能會發生交流,”他補充道說。“我們離發展出這樣的AI技術還有很長的路要走。主要是因為現有的機器缺乏常識。”

“家貓都比最聰明的機器要更通人性”

——Yann LeCun

常識?但是在很多情況下機器不會比人類做出更好的決定嗎?機器必須具有常識或者表現出來麼?

LeCun解釋了為什麼他們不這樣做:“我們沒有能力讓機器學習龐大的背景知識:我們在生命的最初幾周和幾個月中得到了關於世界的大量背景知識,這和很多動物類似。”

因此,我們都知道機器人不能觸水,就更別說洗碗水了。LeCun認為:我們製造不出靈巧的機器人,因為這些都超出了目前機器人技術的最新水平。不是我們無法制造機器人,而是我們不知道如何建立他們的大腦。我們不知道如何訓練機器人理解我們的日常活動,例如繞過障礙以及如何放置物品。

鑑於LeCun在人工智能應用方面的地位,他的話聽起似乎有些草率。但是,當他考慮到人工智能在醫療等領域的飛速發展時,他仍然對人工智能的未來抱有很大的希望與好奇。

他認為,通過醫學圖像分析,可以訓練卷積神經網絡來檢測CT掃描圖或MRIS中的腫瘤,或者從皮膚圖像中檢測黑色素瘤,這將對放射學產生深遠的影響。

這正應了LeCun在7月8日,也就是58歲說過的一句話:“深度網絡既優雅又閃耀。”

相關報道:

https://www.forbes.com/sites/insights-intelai/2018/07/17/yann-lecun-an-ai-groundbreaker-takes-stock/#84757b4586c8


分享到:


相關文章: