12.24 通向人工智能產業落地化的道路在哪?

整理 | 夕顏

出品 | AI科技大本營(

ID:rgznai100)

世事浮雲,白雲蒼狗,轉眼間關於人工智能的研究已歷經兩個世紀。

在研究者和踐行者的不懈努力之下,如今人工智能應用已遍地可見,無論是繁華都市還是偏遠小鎮,街頭巷尾偶遇可稱為人工智能的應用並不算稀奇。

然而,人們並不滿足於碎片式的點狀應用,更想要早日實現先驅們最初設定的宏願——通用人工智能。但攀上這座高峰還遙遙無期。

要如何攀上通用人工智能的頂峰,專家們指出了不算很多的道路,但每條道路目前來說都不好走。

比如,最為人們青睞且最有前途的,當屬深度學習這條“康莊大道”無疑。許多人以為,深度學習能夠解決一切問題,放之所有領域皆為準,但事實證明,深度神經網絡的確能夠被訓練下圍棋,也能流水線上做釘鉚,但同一個網絡不能同時做這兩件事,時至今日,尚沒有一個用深度學習實現通用人工智能的完整路線圖。不僅如此,深度學習與生俱來的弱點也日益暴露出來,如不可解釋性、大量依賴數據、成本高昂等,所以,這條路能否通向通用人工智能要被打上一個

大大的問號。

又有人提出,可以整合各種專用“模塊”於一個“構架”之中,讓它們分工協作,這樣就能拼成一個通用系統。但這個思路理論上可行,但實施起來卻難如登天,比如算法或設計本身的功能可能就是複雜且矛盾的,要協調好不計其數的“模塊”,就是一個浩繁的工程。

除此之外,還有人試圖通過構造更像人腦的模型,來模仿人類各認知功能的統一再現,這就是所謂的“全腦模擬”。

“全腦模擬”的概念基於一個原理,即生命的主題是大腦,於是,20 世紀初,谷歌的科學家們提出一個大膽的想法——將人腦原封不動地移植到以神經網絡為架構的 AI 上,這樣人腦就可以永生,人也就能永生。然而,這個想法雖然讓人興奮,但實行起來難度更大,因為人的大腦共有約860 億個神經細胞,如果用神經迴路來模擬大腦,即使用當代速度最快內存最大的超級計算機,也只能模擬大腦的百分之一。這讓大腦移植似乎變得不可能。

但是,這阻擋不了科學家的研究熱情。2018 年,日本理化學研究所和德國的 Jurich 研究所聯手,通過對網絡算法進行改善,使得神經網絡的性能提高到了原來的將近 100 倍,新的算法通過概率預測,刪除了很多不必要的信號通信。改善後的算法在性能上完全有可能對全腦進行模擬。

全球還有無數人在進行著類似的研究,美國的腦計劃、歐洲的腦計劃和中國的腦計劃就是這一理論的積極倡導者,為項目投資也逐年提高。2018年,美國對腦計劃的支持總額超過 4 億美元,同比增長 50%;經過近 3 年的醞釀,中國的腦計劃也於 2018 年正式掛牌,作為重大科技項目被列入國家“十三五”規劃,僅招聘頂級專家就投入 1.8 億元人民幣真金白銀。

然而,這些本來被視為“人類之光”的計劃似乎並沒有預期進行得那麼順利。2013 年,歐盟大手一揮撥了 13 億歐元(目前匯率約合 99 億元人民幣)成立了歐盟“人類腦計劃”,但如今實施週期已過半,距離模擬出人腦卻還很遙遠,至今沒能拿出像樣的成果出來。於是這一計劃開始遭到科學界的質疑,歐盟也已經決定不再“將所有的雞蛋放在一個籃子裡”,減小對歐盟“人類腦計劃”的投資,這讓後者的前途未卜。

既然此路難走,那就再想其他辦法。

科大訊飛在人工智能領域可算得上是先行者之一,因為早年預判語音技術將成為人工智能技術應用突破口的獨到眼光,開闢出一條語音之路,如今已躋身這一領域的第一方陣。

這家科技公司對於通用人工智能的實現途徑也有自己的看法,並提出了一個概念——智能動力學,並將之視為實現通用人工智能的三條途徑之一。

機緣巧合,筆者有幸採訪到科大訊飛聯合創始人、輪值總裁胡鬱,探討了“智能動力學”究竟是何解。

通向人工智能产业落地化的道路在哪?

智能動力學:實現AI的第三條途徑

在胡鬱的解釋下,筆者大致明白了“智能動力學”其實是一個相對“空氣動力學”而來的概念,通俗來講,就是像人類研究鳥類飛行一樣,最後研究出“空氣動力學”,造出了比鳥更好的飛機,它不用像鳥一樣吃喝拉撒,但比鳥還快,因為飛機遵循鳥類羽毛空氣動力學的基礎理論。相應地,隨著我們對人類大腦理解越來越深入,對人類大腦拓撲結構和學習機制理解更深,我們完全有可能發明一種“智能動力學”的東西,它可以在學習人腦的學習機理、人腦結構後,與計算機的速度快、存得多的特點完美結合在一起,產生強人工智能甚至超人工智能。

這是胡鬱認為的實現人工智能的三條途徑之一,而其他兩條是英雄所見略同,就是上文提到的深度神經網絡和全腦模擬。

關於人工智能的實現路徑,相信很多人和筆者一樣,瞭解更多的是深度神經網絡。為什麼全腦模擬和智能動力學少被提及呢?

後兩者和深度神經網絡相比有何異同點?為什麼深度神經網絡比後兩者的概念更火?

胡鬱回答了筆者這個疑問。他說道,“現在利用大數據加上深度學習的方式是主流的方法。但是從研究的角度來講,我認為深度學習只是研究中的一種路徑而已,而從工業化的角度來說,深度學習的可操作性、穩定性和目前跨過實用門檻的能力目前還是最強的。但是它也有一些問題,比如需要的數據量巨大,而且對於人類的某些智能,例如認知智能,用現在深度神經網絡的方法來做,就會面臨一些挑戰,因為沒有足夠的大數據來支撐。人類在學習過程中其實不依賴大數據,而是小樣本,它依賴少量的案例或數據就能夠學習,這導致現在的大數據系統其實有一些不足。”

所以,這也是訊飛提出“智能動力學”的一個主要原因,訊飛要學習人腦的學習機理,神經元的連接方式和神經元類型,希望得到更好的基於類似於人類學習方式的組合。

所以,他認為,當前正在使用的還是大數據、人工智能,即基於大數據的機器學習的人工智能。但是將來,訊飛想要發展智能動力學,這是他們的目標之一。

用一兩句話概括,後兩者相比於深度神經網絡最大的不同點和優勢在於,採用智能動力學的方法能夠更好地將人腦的思維方式和學習方法與電子計算機進行結合,從而實現小樣本學習和遷移學習,後兩者在這些方面會比較強一點。

既然全腦模擬和智能動力學有這麼多優點,它們是否有望克服深度神經網絡的缺點,實現通用人工智能呢?

胡鬱給出的答案在預料之中,但仍不免讓筆者感到一絲惋惜。

他說道:“全腦模擬是從現代腦科學研究的一個分支,我並不認為腦科學就是全腦模擬,並在將來能帶來一個好的人工智能的前景,我更相信的是智能動力學可能會給我們帶來智能動力學研究腦工作的原理,並把這種原理放到人工智能系統中,比如與深度神經網絡相結合。所以,它的優勢是能夠真正地探索人腦的奧秘,並在我們現在還不太擅長的領域取得突破性的進展。特別是我在報告中(鏈接)提到的在認知智能方面,我認為會產生非常好的作用。”

現在,智能動力學還是一個訊飛提出的設想,想要將人工智能和腦科學研究的最新成果結合在一起,但還沒有得到應用。

但胡鬱說道,將來智能動力學的應用方向和領域與人工智能、大數據一樣廣闊,並有望在認知智能,比如更好地理解人的意圖,學習專家系統知識這些方面發揮更大的作用。

既然本文想要探索的那條通向通用人工智能的正確道路還沒有絕對答案,那不妨來看一看,在當下的相關研究中有哪些最新的研究動向和趨勢吧。

知識圖譜將是大戶數據平臺的核心技術

大數據中臺的概念近來很受關注,科大訊飛也有自己的大數據平臺 Odeon。Odeon大數據平臺與訊飛的人工智能算法和應用緊密結合在一起,通過底層硬件、大數據存儲和管理平臺和人工智能學習和運算算法這三層,Odeon 大數據平臺將訊飛正在做的感知智能,即語音和圖像技術和認知智能(語言理解、知識表達、邏輯推理和最終決策等)緊密地

結合在一起,達到更好的處理效果。

有人認為,因為知識圖譜具有探索式分析的能力,將成為下一代大數據平臺的核心技術。知識圖譜真的具有如此大的潛力嗎?它的作用是否被誇了?

對此,胡鬱認為,知識圖譜是認知智能取得突破的一個非常重要的方面,因為人的大腦就是按照知識圖譜的方式來組織知識的,但是人與計算機相比的存儲能力較小,圖譜確實作為數據的中臺,是人工智能感知、認知智能方面的一個必不可少的突破方向。它其實是將原來的知識全部結構化,並在它們之間生成邏輯的關聯結構。

“我認為,知識圖譜在很多領域,特別是專家系統領域會有非常廣泛的應用,比如現在講的專家系統主要用於教育、醫療、司法和智慧城市等方面。在醫療方面,訊飛做了智能助理,它能夠根據建立的病症和表現之間的知識圖譜。通過知識圖譜推理預測用戶可能得病的概率,更好地幫助醫生進行病情判斷。另外,知識圖譜在推理上具有優勢,在邏輯推理方面非常實用,因此,知識圖譜在自然語言理解,知識表達和邏輯推理方面都將有非常重要的作用。”

機器翻譯要“達”、“雅”,需要理解和常識

下一個疑問轉移到訊飛憑之起家,同時非常擅長的機器翻譯上。

有專家認為,近兩年來機器翻譯有了很大的進展,但實際上都是靠大數據驅動的,大數據驅動的帶來的好處是機器翻譯性能得到飛速提升。然而問題是,因為大數據驅動深度學習是典型的“黑盒子”,雖然翻譯效果不錯,但其實機器對句子沒有任何理解。這樣的系統在處理複雜語義時非常脆弱,即使是非常簡單的日常詞彙,目前最先進的機器翻譯系統也無法做到準確翻譯。

面對這個略尖銳的問題,胡鬱給出了自己的看法,“我認為這應該從兩個方面來看,我們都知道AlphaGo 戰勝李世石 9 段柯傑 9 段,憑的是算得快、存得多的優勢,但這並不妨礙它打敗李世石和柯傑。所以,一方面我認為在大部分翻譯領域,機器翻譯已經做得不錯了。現在,機器翻譯做得不好的地方,可能是佔比非常小的俚語,機器翻譯的特點是沒看到過就不會翻,對於一些非常複雜的特殊情況,翻譯的效果可能會打折扣。所以,從另外一個角度來看,翻譯要求“信達雅”,人類在“達”和“雅”這兩個方面還具有一定的優勢。我不認為機器翻譯將來就要完全取代人類,它只是幫大家解決大部分的比較簡單的工作,而不是讓人類最後都沒飯吃。 ”

歸根結底,機器翻譯效果有時差強人意,也有一個重要的原因——機器不懂人的常識。問題存在就要想辦法解決,機器難以具備常識已經不是個新鮮問題,從機器翻譯概念提出伊始這個問題就糾纏了研究者很久,卻至今未得到解決。打造常識知識庫是解決這個問題的基礎。

通向人工智能产业落地化的道路在哪?

清華大學計算機科學與技術系教授孫茂松曾說過,打造好的知識庫,有兩個可行的辦法,一個是把現有世界各方面的知識庫都拿來先做整合,從中汲取養分。另一個辦法是從文本中挖掘知識庫,從文本中找到知識並進行形式化。為此,清華大學正在聯合各方研究機構打造這樣一個知識庫。

胡鬱認為,常識知識庫非常重要,但它有一個特點是很難通過大數據獲得,因為人類的常識不是以文字形式被記錄的。但是科大訊飛有嘗試構建這樣的常識知識庫,但是卻沒有一個好的系統構建的方法。他提到在 Winograd 的常識比賽測評中,科大訊飛獲得了第 1 名,但分數僅有 60分,相比之下,一個人類的小孩卻可以很容易地達到 90 分,所以,胡鬱並不認為現在的常識技術已經達到了應用的門檻。

然而,他對於為機器翻譯的未來充滿希望,相信隨著數據量越來越大,機器犯錯誤的可能性會變得越來越小。機器翻譯要想達到“信達雅”,它不僅要翻譯,還要理解句子的內容。“現在機器翻譯不用理解句子的內容,只需要考慮兩種語言之間的詞對和句對之間的關係,要做到“達”和”雅”,就必須理解句子內容,所以就必須要做知識圖譜。所以,我認為人和機器是各有所長的。”

AI+教育,實現幾千年“因材施教”的教育夢

訊飛被大家熟知的是語音技術,但實際上它不僅關注自然語言理解,在計算機視覺/圖像領域也有很深的研究,比如圖文識別。

胡鬱介紹道,訊飛計算機視覺的研究方向圍繞著應用集成的角度,比如在教育領域做基礎的自動批改,可以識別手寫公式,手寫英文/中文作文,以及識別答題結果,並用機器判斷結果和中間步驟是否正確,利用了大量的圖像識別技術,如 CNN等。圖像相關技術,訊飛應用得最多的還是在教育領域。

在教育領域,人工智能的應用近年來已經很常見,做 AI+教育的企業遍地開花,但很多企業推出的產品都有同質化的傾向,真正推動教育發生革命性變化的產品似乎很少。

胡鬱並不認同這個觀點,他解釋道,很多產品其實表面上看起來差不多,但“裡子”還是有差別的。比如訊飛正在做的所有教學內容的知識圖譜,全國沒有幾家能做出來。

而對於 AI+教育的未來,胡鬱認為應該圍繞學校、老師、家長這三點,滿足這三類人的需求。與傳統教育相比,AI+教育能夠實現因材施教的個性化教學,實現教育界幾千年來的追求。

最後,總結起來,實現通用人工智能的道路還不甚明朗。在浩瀚宇宙中,人類不過是滄海一粟,如果把宇宙的歷史比作一條線,人類歷史充其量算得上是組成這條線的一個小點,而人工智能技術發展史,在這小點上又是一個小到甚至肉眼都看不到的存在。但和世間萬物一樣,人工智能每時每刻都在發生著微不可查的變化,孕育著一場將要改變人類命運的革命。

實現通用人工智能也許只是人類邁向更高文明的一道門檻,而找到通向峰頂的道路,還需要更多像訊飛一樣的先行者,推動 AI 技術不斷實現突破。

採訪嘉賓:

胡鬱,科大訊飛聯合創始人、輪值總裁,中國科學技術大學信號與信息處理專業工學博士,教授級高工;國務院特殊津貼專家;科技部新一代人工智能戰略諮詢委員會委員;科技部863類人智能重點項目首席專家;語音及語言信息處理國家工程實驗室執行

主任;中科院人工智能產學研創新聯盟應用規劃組組長;中國科學技術大學兼職教授、博士生導師;中國人工智能學會副理事長,會士;中文信息學會的常務理事;湖畔大學二期學員。


分享到:


相關文章: