一個偉人曾說過,“情況是在不斷地變化,要使自己的思想適應新的情況,就得學習。
”前文回顧
上一篇講到,我從Java後端轉職過來Java爬蟲,而慢慢沉浸在爬蟲的世界,每天都過得很充實。本文是講,我如何從Java爬蟲過渡到NLP算法工程師。
一次偶然接觸NLP
一天開會,A老大對我說:“我們現在數據也爬了不少了,很多有用的文本數據,我們卻很難利用起來,你來負責研究這塊文本信息的提取與分析。” 就這樣,A老大給了我一個Java包,還有一個英文網站,是專門搞NLP的一群人寫的一個項目。一開始,我是有點疑惑,因為我在爬蟲的開發中很舒適,突然被叫去搞NLP(而且主要我對這塊沒有一點了解,所有對未知有點恐懼,害怕做不好。)
我查了一下,NLP,中文名叫“自然語言處理”,是人工智能裡最最基礎的一塊,也是最難的一塊,目前沒有一個人能說他做的NLP程序是完美,也就是說,NLP領域有很大的潛在研究價值。
我接手了這個任務,每天除了開發爬蟲,就是頭腦風暴,數據分析,文本分析,並且開啟了996模式。
“再長的路,一步步也能走完,再短的路,不邁開雙腳也無法到達。”
初級NLP應用
只要你動手去幹,就會發現難題會一點一點解開。NLP裡面有:分詞、詞性分析、句法分析、命名實體識別等基礎用法,還有一些像語義理解、知識圖譜等高級用法。
我學的是基礎用法,因為一開始任務也不是很難,主要是找文本關鍵詞、提取高頻詞、詞性分析(名詞、動詞、形容詞等)、近義詞替換、命名實體識別等等。漸漸的,有開發的感覺了。
經歷了近半年的NLP算法薰陶(其實,我也不是非常懂NLP算法,只是湊巧做了這麼些零零碎碎的落地項目)。就這樣,我離職的時候,離職證明上寫著,離職前崗位:“NLP算法工程師”
你以為,我就這樣成功轉型NLP了嗎?不,接下來的路還很難走。
未完待續 ......
閱讀更多 IT可達鴨 的文章