04.03 想入行人工智能?看完這篇文章再做決定!

感興趣的就關注公眾號"平凡而詩意"哦,會有驚喜等著你。


很多想進入人工智能領域的同學會問:現在進入人工智能會跳進坑裡嗎?我來回答一下:就目前來說,人工智能的每個方向都很坑,實用性都非常差,包括計算機視覺、自然語言、機器學習在內。

下面就說一下目前機器學習的幾個弊端。

無法做因果推理

圖靈獎得主、貝葉斯網絡之父Judea Pearl在arXiv上傳了論文Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution,論述當前機器學習理論侷限,並給出來自因果推理的7大啟發。Judea Pearl指出,當前的機器學習系統幾乎完全以統計學或無模型的方式運行,這對它的性能造成嚴重的理論限制,不能作為強AI的基礎。他認為突破口在於“因果革命”,借鑑結構性因果推理模型,能對自動化推理做出獨特貢獻。

Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution​

arxiv.org

想入行人工智能?看完這篇文章再做決定!

模型可解釋性差

為什麼深度學習效果好?學習率、權重衰減、卷積核尺寸這些超參數設置在多大合適?目前是沒有合理的數學模型解釋的。就是說,你沿著某個方向去調參,效果好壞是未知的。所以,現在深度學習還是一個經驗積累佔主導的方向。所以,吳恩達的課程《深度學習工程師》主要以“策略”為主,遇到什麼樣的情況該用什麼“策略”解決,偏差、方差用什麼“策略”均衡等等。

數據限制

人工智能50%,甚至60%、70%的時間都用在數據方面,

  • 數據準備
  • 數據增廣
  • 數據去噪
  • 數據標註
  • ......

尤其是數據準備過程,非常費勁,尤其是涉及到隱私的數據,記得之前做過一個醫學圖像識別的項目,前期一直想方設法和不同醫院合作獲取數據,等待了幾個月才獲得幾十副圖像,這對於傳統目標識別也不夠用啊!最後沒辦法,就在網上拼拼湊湊找了一個公開和付費的數據集,剛把環境配置好、模型跑通,這時Google在JAMA上發了一篇文章,和我們的方向一模一樣,一下子給堵死了。看了那篇文章,Google在數據準備方面花費了8年時間,在不同國家同步進行採集,這對於一個小公司來說是望塵莫及的。

實用性差

目前人工智能很多技術都處於定製化階段,遠遠達不到通用化程度。國內某些創業公司頻頻在CVPR、COCO等頂會、挑戰賽露臉,看著實驗對比數據精度方面的確非常不錯。但是,真正應用時卻不同了,效果非常侷限。

首先,二維與三維的區別。拿計算機視覺來說,現實世界是三維空間,無論是人臉還是醫學MR圖像,而目前圖像識別還僅限於二維空間,這在精度、安全性、空間信息等方面會做大量的妥協,所以,這就限制了它在一些要求嚴苛的應用場景的推廣,比如醫學診斷。

其次,動作與狀態的區別。到實際應用中,僅僅識別出來這個人是誰、這個物體是什麼是遠遠不夠的。比如,做一個路面遺留物體的識別,這對於反恐這些場景有一些應用。目前目標識別算法能夠識別出處於某種狀態的一個物體,但是“遺留”是一個包含上下文信息的連續動作

,這就需要其他的輔助算法,比如光流、視頻分析等。

核心假設有問題

現有機器學習算法的核心假設是實例彼此獨立,但是現實狀態空間內,每個實例都與周圍其他的實例存在一定的關聯,含有一些複雜的連接信息,但是目前機器學習受限於它的核心假設,忽略了數據之間的依賴關係。


所以,我認為受限於因果推理、模型解釋性、數據集、實用性、核心假設等方面的限制,目前人工智能大多數方向都比較坑。進入企業後如果學歷高一些,可能還會做一些深入的研究,但是如果本碩進入企業會發現和想象的差別巨大,日常工作無外乎搭建平臺、跑模型、調參、處理數據......可以說,就是一些重複性的體力勞動。機器學習這幾年的確取得了顯著的成果,但是這些成果主要應該歸功於計算資源的快速發展(如GPU)和大量數據的收集。

那為什麼人工智能還這麼火呢?

理想狀態下人工智能的確很有價值,能取代很多人力勞動。但是“理想很豐滿,現實卻很骨感”,目前並沒有想象的那麼美好。人工智能之所以如此火熱,無外乎是因為和利益掛鉤了,

學術上容易發文章、創業公司可以利用信息差騙取投資、大公司可以拿來做噱頭捆綁銷售。

總之,目前進入人工智能領域,需要慎重謹慎,也許當你踏入這個領域時你才發現,它並非你想的那樣,當然,如果十分感興趣,也無可厚非。


分享到:


相關文章: