電腦已經向我們學習了。但是他們能自學嗎?

這篇文章是我們最新文章的一部分人工智能專題報告,它關注技術如何繼續發展並影響我們的生活。

人工智能似乎無處不在,但我們真正見證的是一場有監督的學習革命:我們教計算機看模式,就像我們教兒童閱讀一樣。但是研究人員說,人工智能的未來依賴於沒有監督的獨立學習的計算機系統。

當一位母親指著一隻狗,告訴她的孩子,“看看這隻狗”,孩子學會了怎麼稱呼毛茸茸的四條腿的朋友。這就是監督學習。但是當那個嬰兒一次又一次地站著、蹣跚著,直到她能走路時,那就是另一回事了。

電腦是一樣的。正如人類主要通過觀察或反覆試驗來學習一樣,計算機將不得不超越監督學習,以達到人類智能的聖盃。

“我們希望從需要大量人類知識和人工工程的系統轉向“越來越多的自主系統”,麻省理工學院-IBM沃森人工智能實驗室的IBM主管大衛·考克斯說。他指出,即使一個有監督的學習系統閱讀了世界上所有的書,它仍然缺乏人類水平的智力,因為我們的很多知識從未被記錄下來。

電腦已經向我們學習了。但是他們能自學嗎?

臉書,通過美聯社雅恩·樂村,臉譜網副總裁兼首席人工智能科學家。

監督學習依賴於帶註釋的數據:圖像、音頻或文本,這些都是由一群工人辛苦標記的。他們在街道交通的圖片上圈出人們或勾勒出自行車的輪廓。標記的數據被輸入計算機算法,教算法尋找什麼。在攝取了數百萬張有標籤的圖像後,這些算法在識別他們被教導看到的東西方面變得很專業。

但是監督學習被限制在由訓練數據定義的相對狹窄的領域。“由於你需要大量有標籤的數據,所以今天你可以應用的有監督的學習是有限的,”Yann LeCun說,他是當前人工智能革命的創始人之一,也是2018年相當於諾貝爾計算機科學獎的圖靈獎獲得者。他是臉譜網的副總裁兼首席人工智能科學家。

不依賴於這種精確的人工監督的方法,雖然很少被探索,但被監督學習的成功及其許多實際應用——從自動駕駛汽車到語言翻譯——所掩蓋。但是監督學習仍然不能做很多簡單的事情,即使是對初學走路的孩子來說。

電腦已經向我們學習了。但是他們能自學嗎?

紐約時報的雷諾·菲利普約舒亞·本吉奧創建了魁北克人工智能研究所Mila,並與勒肯博士和傑弗裡·辛頓分享了圖靈獎。

“這對於人工智能來說是不夠的,”約舒亞·本吉奧說,他創建了米拉,魁北克人工智能研究所,並與勒昆博士和傑弗裡·辛頓分享了圖靈獎。“人類不需要那麼多監督。”

現在,處於人工智能研究前沿的科學家們已經將注意力轉向了監督較少的方法。“有自我監督和其他相關的想法,比如在將模型壓縮後重建輸入,預測視頻的未來或屏蔽部分輸入並試圖重建它,”優勝華的兄弟兼谷歌研究科學家薩米·本吉奧(Samy Bengio)說。

還有強化學習,監督非常有限,不依賴於培訓數據。現在在加拿大阿爾伯塔大學的理查德·薩頓開創了計算機科學中的強化學習,它是以大腦中的獎勵驅動學習為模型的:想象一隻老鼠在學習推動一個槓桿來接受一粒食物。該策略已被開發出來,用於教導計算機系統採取行動。

設定一個目標,一個強化學習系統將通過反覆試驗朝著這個目標努力,直到它一直得到回報。人類總是這樣。“如果你研究心理學,強化是一個顯而易見的想法,”薩頓博士說。

《紐約時報》的羅伯特·裡格爾彼得·阿比埃爾在加利福尼亞經營著伯克利機器人學習實驗室。

他說,對於人工智能的未來,一個更具包容性的術語是“預測性學習”,這意味著系統不僅能識別模式,還能預測結果並選擇行動方案。“每個人都同意我們需要預測性學習,但我們不同意如何達到這個目標,”薩頓博士說。“有些人認為我們是在監督學習理念的基礎上發展起來的;其他人認為,我們是通過強化學習理念的延伸實現這一目標的。”

彼得·阿貝耳是加州伯克利機器人學習實驗室的負責人,他使用強化學習系統,通過一種叫做自我遊戲的方法,與自己競爭,以更快地學習。例如,相同的模擬機器人相撲,起初並不是很好,但很快就有所改進。“通過與你自己的水平或與你自己對抗,你可以看到什麼樣的變化有助於逐漸積累技能,”他說。

儘管強化學習很強大,但勒肯博士說,他認為其他形式的機器學習對一般智力來說更為關鍵。“我的錢都花在自我監督的學習上了,”他說,指的是那些接收大量未標記數據的計算機系統,它們在沒有監督或獎勵的情況下理解這些數據。他正在研究通過觀察學習的模型,積累了足夠的背景知識,可以產生某種常識。

“想象一下,你給這臺機器一段輸入,比如一個視頻剪輯,然後讓它預測下一步會發生什麼,”萊坤博士在紐約大學的辦公室裡說,他的辦公室裝飾著電影《2001:太空漫遊》的劇照“為了讓機器訓練自己做到這一點,它必須開發一些數據表示。它必須明白,有些物體是有生命的,有些是無生命的。無生命的物體有可預測的軌跡,而其他物體沒有。”

他說,在一個自我監督的計算機系統“觀看”了數百萬個YouTube視頻之後,它將從這些視頻中提取一些世界的代表。然後,當系統被要求執行一個特定的任務時,它可以利用這個表示——換句話說,它可以自學。

麻省理工學院-國際商用機器公司沃森人工智能實驗室的考克斯博士也在進行類似的工作,但是他將更傳統形式的人工智能與他的實驗室稱之為神經符號人工智能的深層網絡相結合。他說,目標是建立一個人工智能系統,能夠獲得與人類相似的常識知識的基線水平。

“我們在日常工作中所做的很大一部分就是不斷完善我們對世界的心智模型,然後用這些心智模型來解決問題,”他說。“這概括了我們希望人工智能做的許多事情。”

許多人希望機器人最終能體現人工智能,並在世界上自由行動。但要讓他們達到目標,需要的不僅僅是監督學習。目前,機器人只能在定義明確、變化很小的環境中工作。

電腦已經向我們學習了。但是他們能自學嗎?

自從人工智能發展以來,技術的界限已經被打破,挑戰它比人類思考和行動更快。最優秀的人才與機器競爭,看誰能勝出。在這裡,我們回顧一下人類和計算機之間的一些最好的競賽。

伯克利的助理教授謝爾蓋·萊文(Sergey Levine)說:“我們的工作假設是,如果我們構建了足夠通用的算法,那麼一旦完成了,我們真正要做的就是將它們放入機器人中,讓它們在現實世界中做真實的事情。”他經營著該大學的機器人人工智能和學習實驗室。

他正在使用一種自我監督的學習方式,在這種方式中,機器人探索他們的環境,並建立起勒昆博士和考克斯博士正在談論的基礎知識。“他們只是在自己的環境中玩耍和學習,”萊文博士談到實驗室的機器人時說。“機器人本質上是在想象可能發生的事情,然後試圖找出如何讓它發生。”

通過這樣做,機器人積累了大量的知識,可以在新的環境中使用。最終,機器人可以聯網,這樣它們就可以分享各自獲得的知識。

“一個機器人花幾個小時擺弄一扇門,來回移動,它就能打開那扇門,”萊文博士說。“我們有六個不同的機器人,所以如果我們讓他們都玩不同種類的門,也許當我們給一個人一個新的門時,它實際上會推廣到那個新的門,因為它已經看到了足夠的多樣性。”

蓋蒂農業中的智能機器人農民未來機器人自動化到蔬菜農場,智能農場概念

為工業自動化製造人工智能機器人的公司Covariant的創始人Abbeel博士說,所有這些方法最終都有可能結合起來。我們能在某個時候製造出像人類一樣智能的機器嗎?“當然;毫無疑問,”勒昆博士說。“這只是時間問題。”

克雷格·史密斯是《泰晤士報》的前記者,主持播客“關注人工智能”


分享到:


相關文章: