2019-04-03 23:32:07 Jackpop

感興趣的就關注公眾號"平凡而詩意"哦，會有驚喜等著你。

很多想進入人工智能領域的同學會問：現在進入人工智能會跳進坑裡嗎？我來回答一下：就目前來說，人工智能的每個方向都很坑，實用性都非常差，包括計算機視覺、自然語言、機器學習在內。

下面就說一下目前機器學習的幾個弊端。

無法做因果推理

圖靈獎得主、貝葉斯網絡之父Judea Pearl在arXiv上傳了論文Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution，論述當前機器學習理論侷限，並給出來自因果推理的7大啟發。Judea Pearl指出，當前的機器學習系統幾乎完全以統計學或無模型的方式運行，這對它的性能造成嚴重的理論限制，不能作為強AI的基礎。他認為突破口在於“因果革命”，借鑑結構性因果推理模型，能對自動化推理做出獨特貢獻。

Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution

arxiv.org

模型可解釋性差

為什麼深度學習效果好？學習率、權重衰減、卷積核尺寸這些超參數設置在多大合適？目前是沒有合理的數學模型解釋的。就是說，你沿著某個方向去調參，效果好壞是未知的。所以，現在深度學習還是一個經驗積累佔主導的方向。所以，吳恩達的課程《深度學習工程師》主要以“策略”為主，遇到什麼樣的情況該用什麼“策略”解決，偏差、方差用什麼“策略”均衡等等。

數據限制

人工智能50%，甚至60%、70%的時間都用在數據方面，

數據準備
數據增廣
數據去噪
數據標註
......

尤其是數據準備過程，非常費勁，尤其是涉及到隱私的數據，記得之前做過一個醫學圖像識別的項目，前期一直想方設法和不同醫院合作獲取數據，等待了幾個月才獲得幾十副圖像，這對於傳統目標識別也不夠用啊！最後沒辦法，就在網上拼拼湊湊找了一個公開和付費的數據集，剛把環境配置好、模型跑通，這時Google在JAMA上發了一篇文章，和我們的方向一模一樣，一下子給堵死了。看了那篇文章，Google在數據準備方面花費了8年時間，在不同國家同步進行採集，這對於一個小公司來說是望塵莫及的。

實用性差

目前人工智能很多技術都處於定製化階段，遠遠達不到通用化程度。國內某些創業公司頻頻在CVPR、COCO等頂會、挑戰賽露臉，看著實驗對比數據精度方面的確非常不錯。但是，真正應用時卻不同了，效果非常侷限。

首先，二維與三維的區別。拿計算機視覺來說，現實世界是三維空間，無論是人臉還是醫學MR圖像，而目前圖像識別還僅限於二維空間，這在精度、安全性、空間信息等方面會做大量的妥協，所以，這就限制了它在一些要求嚴苛的應用場景的推廣，比如醫學診斷。

其次，動作與狀態的區別。到實際應用中，僅僅識別出來這個人是誰、這個物體是什麼是遠遠不夠的。比如，做一個路面遺留物體的識別，這對於反恐這些場景有一些應用。目前目標識別算法能夠識別出處於某種狀態的一個物體，但是“遺留”是一個包含上下文信息的連續動作

，這就需要其他的輔助算法，比如光流、視頻分析等。

核心假設有問題

現有機器學習算法的核心假設是實例彼此獨立，但是現實狀態空間內，每個實例都與周圍其他的實例存在一定的關聯，含有一些複雜的連接信息，但是目前機器學習受限於它的核心假設，忽略了數據之間的依賴關係。

所以，我認為受限於因果推理、模型解釋性、數據集、實用性、核心假設等方面的限制，目前人工智能大多數方向都比較坑。進入企業後如果學歷高一些，可能還會做一些深入的研究，但是如果本碩進入企業會發現和想象的差別巨大，日常工作無外乎搭建平臺、跑模型、調參、處理數據......可以說，就是一些重複性的體力勞動。機器學習這幾年的確取得了顯著的成果，但是這些成果主要應該歸功於計算資源的快速發展（如GPU）和大量數據的收集。

那為什麼人工智能還這麼火呢？

理想狀態下人工智能的確很有價值，能取代很多人力勞動。但是“理想很豐滿，現實卻很骨感”，目前並沒有想象的那麼美好。人工智能之所以如此火熱，無外乎是因為和利益掛鉤了，

學術上容易發文章、創業公司可以利用信息差騙取投資、大公司可以拿來做噱頭捆綁銷售。

總之，目前進入人工智能領域，需要慎重謹慎，也許當你踏入這個領域時你才發現，它並非你想的那樣，當然，如果十分感興趣，也無可厚非。

分享到:

閱讀更多 Jackpop 的文章

關鍵字: 人工智能我來增廣賢文