03.14 CAAI特約專欄丨芮勇 遇見AI的芳華年代

轉自 CAAI會員中心

來源:《中國人工智能學會通訊》2018年第1期特約專欄

CAAI特約專欄丨芮勇 遇見AI的芳華年代

從 1956 年“人工智能”(AI)這個詞被髮明出來, 人工智能技術在演化中,先後遭遇了三個夏天、兩個冬天。現在“天時、地利、人和”,在各種因素的作用下,它終於迎來了發展的芳華年代。

PC³的時代洪流

AI 的芳華年代,契合了 PC³ 的時代洪流。

回望 IT 產業發展的 40 多年,PC 的定義一直在不斷演進中。第一個 PC 的定義出現在上世紀 80 年代初期。在那個時代,如果你問任何一個人,什麼是 PC ?大家都會毫不猶豫地回答: PC 就是 Personal Computer,即個人計算機。2005 年以後,我們逐漸進入了 PC² 時代。這個時候如果再問業界什麼是 PC,更多人會回答是個人計算(Personal Computing),即不僅僅限於個人計算機,還包含各種可提供計算能力的設備,如手機、Pad、智能手錶等等。

而就在最近,IT 產業終於迎來了一個嶄新的時代——PC³ 時代。這第三個 PC,既不是個人計算機,也不是個人計算,而是個性化的計算(Personalized Computing)。個性化的計算和之前的兩個 PC 大不相同,它讓各種個人設備連接雲端,這些設備能觀察用戶、學習用戶,從而提供高度定製化、個性化的服務,因此整體而言,這些最終用戶所接受到的服務,是千人千面的,並且服務模式也有本質的差別。之前兩個階段的 PC 最終提供的服務,基本都是用戶主動請求發起的,而 PC³ 對應的個性化服務,則是設備和雲端根據觀察到的用戶行為,經提煉後主動推送的服務。

個性化計算最核心的技術,就是人工智能技術。人工智能為 PC³提供了波瀾壯闊的應用前景。事實上,不僅在個性化計算的場景裡面,很多企業級應用也同樣需要 AI 技術來賦能。那麼,AI 怎樣才能實現大發展,加速全行業?

AI 的 ABCD

我總結下來,人工智能要真正成功,離不開四大要素,它們的英文首字母正好是 ABCD。A 代表算法 Algorithm;B 代表行業 Business; C 就是計算力 Computing Power;D 即為數據 Data。其中行業很關鍵,這是因為算法再厲害,數據再多,計算模型再好,也只是工具層面,只有與行業相結合,才能真正改造行業,比如結合醫療領域的智慧醫療、結合 PC³的數字助理等。

事實上,這四個要素與人工智能的關係,如同關鍵部件和汽車的關係。如果我們把AI 比作一輛汽車,那麼算法 A 相當於車的引擎,驅動車輛往前行駛;行業 B 就如同車的方向盤一樣,決定了走向哪個垂直行業; 計算力 C 就像車輪一樣承載整個車輛;而數據 D 就是車裡的油,只有數據才能最終推動算法完成車輛行駛。

算法的重要程度不言而喻。從算法的沿革看,五大學派依次興起,又獨立發展。在上世紀 50 年代邏輯迴歸和感知器人工神經網絡分別起源,一直髮展到 90 年代初的Kernel Trick,把 SVM 推到一個非常高的高度。貝葉斯學派的典型代表 HMM 於 70 年代中期應用於語音識別,隨後推廣到生物信息學,中間還有專家系統在 80 年代末 90年代初的曇花一現。一直到了 2006 年前後,從神經網絡又跨越到了深度學習。深度學習是今天打敗人類機器算法中的傑出代表。過去十來年,出現了諸如 auto encoding 等非監督學習算法的改進方案。而針對初始化人工神經網絡的問題,也有 drop outs 可以極大改善過擬合。Residual network 實現了深度多層的學習和跨層直接學習相結合。生成對抗網絡又解決了怎麼生成非常逼真數據的問題。整體而言,算法一直在發展中,而且其發展不是線性的,更多的是藉助躍變,呈現一個臺階、一個臺階的上升。

接下去再說計算力 C,行業 B 的重要性留到文末呈現。如今運算力已經有了長足的發展。底層,我們支持不同的架構,包括 GPU,CPU 甚至包括 FPGA 和嵌入式設備中有著巨大前景的 ASIC。除了底層架構,上層的計算框架也在演化,從並行處理的MapReduce,到 Iterative MapReduce,再到現在的 Parameter Server,使得計算框架越來越靈活。而最新的計算框架開始基於各種 flow ,例如谷歌的 tensor flow。當然各種框架有著不同的優缺點,應用的場景也不完全一樣,因此未來很有可能會長期並存、各自演化。此外,計算框架除了支持模型的並行,也開始逐漸支持數據並行,支持同一批數據在不同的模型上並行處理,甚至出現了 Hybrid 混合型,數據和模型都可以並行。運算力的提升和演化,使得原來不可能的計算變為現實,而且並行處理的方式越來越不同。

在數據方面,隨著大數據技術的發展,數據本身的價值正逐漸為公眾所認識。正如《福布斯》所預測的那樣,2020 年全球每人每秒鐘將產生 1.7 M 字節的數據,這一數據量將非常驚人。而數據的價值是什麼?《福布斯》估算,財富排名前 1000 強的企業如果能提升 10% 的數據可獲取性,那麼每年就可以多收益 6500 萬美元的純利。在醫療產業也是如此。如果能更好地集成和利用數據,平均每人每年將節省約 1000 美元的開支。因此,如何彙集並利用數據將是AI 面臨的主要問題之一。而且,數據也並非越多越好,尤其是針對深度學習的網絡,數據的分佈更為重要。例如訓練數據是否能均勻覆蓋問題的集合?當然,生成對抗網絡 GAN 無疑是個非常有意思的嘗試,尤其當數據量不夠時。

最後我們討論一下行業 B。如果回憶一下過去幾十年 IT 產業的發展,我們會發現幾次重大的變革,比如搜索引擎帶來的變革,搜索引擎本身也是一種服務——信息檢索服務。類似的例子還有電子商務,電子商務既是新的服務——在線銷售服務,也是新的變革,因為它改變了零售物流行業。還有社交網絡的興起,如國外的 Facebook以及中國的微信。社交網絡是一種新的社交服務,同時它又足以變革通訊社交行業。而人工智能則不一樣。人工智能引起了全行業的變革,但其本身確非一種具象的服務,它必須和各個行業相結合才能真正落地。例如我們 2017 年 7 月份發佈的聯想“小樂”——一種人工智能和客服相結合的智能客服解決方案。客服呼叫中心目前大多以人力為主,但“小樂”這樣的人工智能客服解決方案能夠處理大部分的呼叫,從而改變了服務行業的面貌。又比如 AI 輔助診斷的智慧醫療是人工智能和醫療診斷結合後的新型服務,它能節約醫生的人力成本、提升診斷效率,並進而改變醫療行業。結合了人工智能的信息產業變革,節約的不僅僅是人力和相關運維成本,更是對社會生產力的一次極大釋放。

AI 的未來

在 AI 大發展的芳華年代,具備了上述的 ABCD,人工智能就能真正迎來百花齊放的壯年。雖然今年我們也看到在 AI 的未來發展方面,出現了一些爭議,例如霍金(Stephen William Hawking) 和馬斯克 (Elon Musk) 就表達了一定程度的 AI 威脅論,但是我個人對 AI 的未來抱著樂觀的態度。

目前看來,人工智能在規則限定的情況下利用計算、記憶優勢已經超過人類,而在真正開放的強人工智能領域,計算機距離人類智慧還有相當長的路要走。人工智能的優勢在於模擬人的左腦,即記憶和推理;而人類的優勢則在右腦,包括想象力和抽象思維能力,這些是人工智能暫時無法做到的。

因此,人工智能的未來,就是要發揮人和機器各自的所長,聚合人類智能和人工智能,打造人機融合、智能增強的新時代。

CAAI特約專欄丨芮勇 遇見AI的芳華年代

博士,現任聯想集團首席技術官、高級副總裁,ACM、IEEE、IAPR 和 SPIE 的會士 (Fellow),負責聯想集團技術戰略和研發方向的規劃和制定,並領導聯想研究院的工作。在此之前,曾在微軟工作 18 年,任微軟亞洲研究院常務副院長等職。


分享到:


相關文章: