仰望星空vs.腳踏實地—AI領域技術從業者進階指南

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

From: QRIUS 編譯:Lin

人工智能是最令人興奮和最具吸引力的領域之一。根據Gartner的數據,全球機器學習市場預計從2017年到2022年將獲得迅速發展。到2020年,人工智能預計將創造230萬個相關工作崗位。 機器學習工程師的平均工資在125,000美元到175,000美元之間。在AI人才收入最高的十大公司中,平均工資輕鬆超過20萬美元。但除了誘人的經濟利益外,迅速發展的行業和高速學習的氛圍都讓這一領域產生了難以抵擋的魅力。本文將詳細介紹人工智能領域工作所要求的行業技能,以及如何腳踏實地地提高自己、習得足夠的能力。

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

人工智能領域的工作是怎樣的呢?

首先,我們需要清晰的定義這一領域的工作內容和崗位職責。

人工智能是一個非常廣泛的術語——它涉及在機器中複製人類學習和行為的理想動力。那我們如何打破誇張的說法呢?讓我們首先談談人工智能的一個特定要素,它有效且能到良好的回報:機器學習。機器學習是人工智能的一個子集,它涉及使用某些規則和算法來嘗試將有用信息從一個數據集推廣到更廣泛的數據集。

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

您可以採用人工分類的標記數據,並通過機器學習擴展邏輯,或讓計算機瀏覽未標記的數據併為您解決問題。您可能會採用類似於深度學習或者強化學習的形式來達到預期的結果。

如果您選擇進入機器學習行業,您將使用數據管道——在從類似數據集中提煉出某些規則後,讓機器為新數據集做出預測和標籤的技能。機器學習是一組用於處理數據的編程工具,深度學習或強化學習是其中的一個子集。

關鍵的區別在於深度學習將通過多層反饋來運作。類似神經網絡的深度學習模型將自我糾正並針對某個結果進行優化,調整自身,使其輸出通過模型中權重的自我修改逐漸匹配其輸入。

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

這可能是最簡單的深度學習模型:也即上文提及的的感知器。在這種情況下,從一系列輸入中,在輸入和輸出之間執行的隱藏計算層會自我修改,直到它到達所需的輸出。

為什麼這很重要呢?因為它構成了您所聽到的各種令人興奮的人工智能創新的基礎,從自動駕駛汽車到視頻/圖像識別。通過創建越來越高效的模型,幫助機器管理數據模式的複雜性,可以擴展到數萬億的可能性,人類可以從自動處理更大規模的數據中受益——從豐富的數據集中獲得更多的信息。這些信息可以讓像Facebook這樣的社交網絡自動對其網絡上的照片進行分類,或者允許某人根據您的搜索歷史進行模式匹配和預測您的行為。

基礎概念和定義

接下來,讓我們明確定義機器學習領域的一些術語,以便我們清晰地理解。

數據科學涉及使用統計和理論來處理大型數據集,以便您可以根據基礎數據集獲得商業領域的答案或預測。

人工智能

是使機器像人類一樣學習和推理的更廣泛的理念,但其中大部分的內容理論多於實踐、想法多於落地。

機器學習是一種創建預測模型的方法,不需要詳盡的編程即可從數據中學習,這是一個具備可操作性的人工智能的子集。

深度學習是機器學習的一個子集,很多情況下特指像卷積神經網絡這樣的模型,它將輸入和輸出與密集的隱藏層相協調,這些隱藏層通過數據給出的監督信號來修正權重的,以達到預期的結果。

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

當您使用數據集和人工智能/機器學習時,傳統而言,在職位上有兩個基本區別:

數據科學家:他們通過模型的結果來分析和重構商業邏輯,並對業務流程給出指導性建議。數據科學家將數據模型的結果傳達給商業決策者,他們也幫助調整和定製模型,幫助企業提出和解決正確的數據問題。

機器學習工程師:他們構建數據管道,允許數據科學家處理大量不斷更新的數據。在實踐中,他們負責為數據科學家定義的模型提供其所需數據,且他們經常負責實現理論中的數據科學模型,並使其大規模地穩定地運行,實現適應超大數據量的產品級的服務。

雖然這裡分為了兩個職位,但根據經驗來看即使兩個廣泛的角色有一些重疊,數據科學家也經常會使用人工智能數據科學背後的理論,而機器學習工程師將在實踐中實施模型。數據科學家往往在機器學習、統計學和數學方面擁有更強的理論基礎,而機器學習工程師通常擁有更強大的軟件工程背景。

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

長遠前景

很多人對人工智能或機器學習的長遠前景仍然缺乏信息。這項工作是否會隨著其他人工智能的自動化而自動化?這個問題的確存在,但就目前而言,更重要的是要將人工智能放到與過去工業革命同樣的情況下去考慮:這波技術浪潮為人們帶來的是全新能力和創造新經濟的可能性。 例如,ATM與銀行員工的數目相關。我們可以從ATM的歷史中瞭解到,自動化並不總是意味著失業,它還意味著新技術可以顛覆已確立的真理。

薪酬

數據科學家在這裡的分類定義中有一個廣泛存在的差異:數據分析師也屬於他們的職權範圍。主要區別在於數據分析師更傾向於分析數據並對已建立的數據模型進行一次性查詢,這些數據模型往往由數據科學家定義。下面將數據分析師和數據科學家角色之間的區別。

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

瞭解這一差異可能非常重要。在美國,數據分析師的平均工資約為6萬美元。 而數據科學家每年將獲得約3萬美元的收入。與此同時,數據工程師每年平均收入約為9萬美元。 然而,專門致力於實現機器學習的工程師收入明顯增加,每年輕鬆超過10萬美元。AI領域的知名人士有時會獲得數百萬美元的紅利和股票,儘管他們往往是在全球頂尖大學或實驗室從事尖端工作和研究的AI從業者。

從廣義上講,如果你想開啟自己人工智能的職業道路,可以開始學習軟件開發的背景知識並學習機器學習理論,或者你可以從機器學習理論並逐步掌握編程在機器學習中的應用。

所需的技能

為了使用人工智能/機器學習,您通常需要四種技能:

· 軟件工程技能——在實踐中構建模型。您要經常使用Python、Pandas、Scikit-Learn、TensorFlow和Spark等工具。在該工具集中熟練工作的能力將決定您處理和管理數據的能力。

· 機器學習

理論知識,這讓您瞭解要構建的模型和原理,以及將某些方法應用於某些數據問題的優缺點。

· 使用統計推斷來快速評估模型是否正常工作的能力。

· 專業的知識以及與商務人士溝通的能力。這不僅因為可以擴大數據中發現價值的影響力,更能在商業層面推動正確的行動,可以幫助實際的業務場景建立起數據驅動的能力。

總的來講機器學習工程師將會在軟件方面投入更多,而數據科學家則更多地依賴於他們在機器學習和統計推理方面的能力,以及與人溝通和分享數據中的發現。

學習方向

為了讓希望入坑的小夥伴們更好地地掌握機器學習和人工智能,下面提供了軟件、理論和就業方面的資源。

軟件能力(偏向大數據方向)

· python與機器學習:作為使用最為廣泛的AI/機器學習語言,python豐富的生態和工具棧為每一個數據科學、機器學習從業人員提供了強大的工具。其中numpy、scipy、pandas、sci-kit等都是重要的python工具包。

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

· ApacheSpark on Databricks:作為工程師需要熟悉大規模數據的使用。Spark提供了豐富的教程來講解如何使用大數據集進行工作的流程。

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

· Tensorflow:作為使用最為廣泛的深度學習框架之一,學習tensorflow深入理解人工智能的具體流程的工作方法,同時分佈式的機器學習、產品級部署和維護也是工程師的一項重要技能。

理論

要想深入理解和熟練掌握機器學習和人工智能,就需要有堅實的理論基礎。需要學習的方向包括概率論、貝葉斯統計、統計學習以及機器學習中的常用算法和現代深度學習的基本理論。

就業

要進入AI行業就需要先了解這個行業。下面推薦了一些社區和網站,可以從中找到豐富的行業經驗和工作信息。包括技術社群Hacker News,初創公司集合AngelList、數據科學郵件列表Data Elixir,以及AI和數據科學領域的工作信息網站KDNuggets和icrunchdata的AI工作信息板。此外要想面試不慌,下面這個鏈接還有高頻41題可以參考:

https://www.springboard.com/blog/machine-learning-interview-questions/

希望想進入AI行業的小夥伴們可以通過上面的介紹,更加清楚自己的方向和所需的準備,然後腳踏實地、夢想成真。

附錄AI學習、就業資源鏈接:

Sotfware:

https://www.springboard.com/resources/learning-paths/machine-learning-python

https://databricks-prod-cloudfront.cloud.databricks.com/public/4027ec902e239c93eaaa8714f173bcfc/346304/2168141618055109/484361/latest.html

https://www.learningtensorflow.com/

https://hadoopilluminated.com/hadoop_illuminated/Public_Bigdata_Sets.html

理論:

https://towardsdatascience.com/a-tour-of-the-top-10-algorithms-for-machine-learning-newbies-dde4edffae11

https://medium.com/mlreview/modern-theory-of-deep-learning-why-does-it-works-so-well-9ee1f7fb2808

https://github.com/norvig/pytudes/blob/master/ipynb/Probability.ipynb

http://www.kevinboone.net/bayes.html

https://machinelearningmastery.com/statistics-for-evaluating-machine-learning-models/

Jobs:

https://news.ycombinator.com/item?id=18113144

https://angel.co/jobs

https://jobs.dataelixir.com/

https://www.kdnuggets.com/jobs/index.html

https://icrunchdata.com/artificial-intelligence-jobs/

https://career.berkeley.edu/Info/InfoInterview

https://www.springboard.com/resources/data-scientist-interview-guide/

https://www.springboard.com/blog/machine-learning-interview-questions/

-The End-

將門是一家以技術創新為切入口的早期創新發掘機構,旗下設有將門創新服務、將門技術社群以及將門投資基金。

將門創新服務專注於使創新的技術落地於真正的應用場景,激活和實現全新的商業價值,服務於行業領先企業和技術創新型創業公司。

將門技術社群專注於幫助技術創新型的創業公司提供來自產、學、研、創領域的核心技術專家的技術分享和學習內容,使創新成為持續的核心競爭力。

將門投資基金專注於投資通過技術創新激活商業場景,實現商業價值的初創企業,關注技術領域包括機器智能、物聯網、自然人機交互、企業計算。在兩年的時間裡,將門投資基金已經投資了包括量化派、碼隆科技、禾賽科技、寬拓科技、杉數科技、迪英加科技等數十傢俱有高成長潛力的技術型創業公司。

如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投後服務,歡迎發送或者推薦項目給我“門”: [email protected]

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

點擊右上角,把文章朋友圈

將門創投

讓創新獲得認可!

[email protected]


分享到:


相關文章: