自然語言處理和計算機視覺,非得二選一,選誰?為什麼?

肖瀟不吃洋芋


選自然語言。如果你是選學科,那就選自然語言,如果你是工作,看你在什麼地方,根據行業分佈選,如果是想在北京,那就選自然語言,如果是在長三角,就選機器人視覺,在深圳就兩者都可以。


如果是工作的角度,選擇以後的發展方向,簡單的說一下計算機視覺和自然語言

1、計算機視覺目前已經比較成熟,包括2D視覺,3D視覺,包括OCR等等都比較成熟。且玩家已經固定了。

我們常規意義上講的計算機視覺也有不同層次的,例如應用於工業的計算機2D,3D視覺。這類主要是配合自動化,傳感器做信息採集,以及比對,做檢測,或者監控使用。比較典型的應用例如早年的CCD檢測,就算這類工業計算機市場的應用。這類工作也被稱為自動化工程師,包括現場調試以及方案編程。錢少,出差多,略有苦逼。但不是沒有前途的行業。只是略有辛苦,不少自動化行業的會進入這一領域。

這類企業比較典型的例如:基恩士,康耐視,大恆圖像,匯川技術等等。(很明顯,如果你想找這類工作,那多數集中在深圳,和長三角)

工業領域略微高深一些機器人視覺,主要應用於機器人導航:SLAM。

通過視覺慣性算法,實現環境描繪,路徑規劃。傳說比較牛逼的tesla無人駕駛,就採用的是視覺慣性導航,目前國內主推的無人駕駛導航,還是激光導航技術(性價比高,技術穩定)。


第二個,計算機視覺,就是比較高大上的圖像智能領域。從場景應用,上面可以有人臉識別技術,動態人臉識別,OCR,細粒圖像技術,以及在此基礎上涉及到的視頻技術:視頻語義理解。

這類偏向於互聯網及消費端的應用。

這類消費類的視覺,國內比較典型的企業:商湯科技,依圖科技,雲從科技,曠視科技。當然還包括大家都熟悉的Apple,google,百度這類互聯網企業,主要應用在計算機以及手機領域。

自然語言的按照整個發展和規劃,還是主要傾向於人工智能的基本入口。

整個自然語言的使用場景,基本上以消費市場為主。

所謂的自然語言,可能有不少人不太懂:就是分析、理解、生成人類語言, 及相關綜合應用。

微信的文字語音轉文字,文字轉聲音,就屬於自然語言最初級的一種形式。

更為高級的是,能夠做語義分析,情感分析,意圖理解。

目前國內比較多的輿情分析網站,就是採用的這種自然語言的分析模式。

自然語言的發展契機就在於,如果要實現人工智能更高的飛躍,就一定需要自然語言的支持,不然人機互動中,你問機器人,我想找點好吃的,他給你推薦一大堆快餐,顯然並不合適。

目前自然語言的應用在消費領域,比較廣泛。

(1)語義理解

最近比較流向的一個網站,

magi.com 就是非常典型的語義理解的搜索引擎。這類引擎也比較多。

(2)篇章理解

篇章理解,目前包括各類輿情監控的軟件。例如百度輿情,融文都是這種篇章理解的應用。從算法上面來說,就是分詞後,提取關鍵詞。(當然我說的比較籠統,用小學的教育,就是找中心思想)

(3)情感分析

情感分析,熟悉Python的朋友,應該都知道,做語義分析中情感分析的重要性。

(4)自動協作

自動協作,其實就是未來服務機器人的範疇了。目前我們常見的siri,或者天貓精靈,都算是這類的入門吧。

(5)語言理解與交互

那個曾經神乎其神的,科大訊飛的同聲翻譯機,就屬於這個範疇。


這個就不細節介紹了,使用過的都懂。

那麼我們看到如果在消費端口,這部分企業分佈比較多。並且一般都是為自家服務,例如OPPO,小米都脫離不了自然語言的開發。所以相對而言,如果你是一直在互聯網領域,那就選自然語言吧。尤其是如果你在北京。北京不缺人工智能,但缺少機器人實體企業。


機器人觀察


這兩個方向都很不錯,關鍵還是看你自己的興趣。


小胖編程


選自然語言處理,因為用的最多。


分享到:


相關文章: