12.25 害怕機器學習從入門到放棄?不妨看看這篇文章

近年來,全世界對機器學習的需求正在蓬勃發展,引起了很多人的興趣。很多數據科學家、軟件工程師和數據分析師都在快速進入這個領域,以期在將來有一個更好的職業發展前景。


然而,很多初學的朋友因為剛剛接觸這個領域,難免有些摸不到頭腦。在網上看的文章也是眾說紛紜,不知道該何去何從。


因此,本文梳理了一些針對初學者的建議,以便讓大家能夠在學習過程中少走一些彎路。



害怕機器學習從入門到放棄?不妨看看這篇文章



1.先設定一個方向與目標

機器學習是一個快速發展的領域,每年都會有很多新的內容出現,而且其應用範圍又極為廣泛。從自然語言處理到圖像識別,從數據挖掘到精準營銷,再從金融風控到量化交易,到處都是機器學習的影子。在面對如此龐大的體系時,初學者很容易出現一種“因為不知道哪個方向好,所以無從下手”的狀態。更有可能這個方向涉獵一點,後面對另外一個方向又產生了興趣,於是又轉了方向,導致每個方向都淺嘗輒止,沒有真正的建樹。


這裡給初學者的建議是:先選定一個方向,並且設定一個小目標。在達到這個目標之前,先不要換方向。實際上不論是何種應用,背後的技術原理大同小異,因此把一個方向吃透並且獲得成就之後,即使再轉向新的應用方向也會比較得心應手。



2.學會跑之前,先學會走

由於很多前沿的應用太過於炫酷,很容易讓初學者產生一種馬上就要投身進去的衝動。例如機器學習中的深度學習和自然語言處理。但這些子領域其實都是建立在機器學習的核心基礎知識之上的,所以最開始時,一定要專注於核心基礎知識上。一旦我們掌握了核心基礎知識,後面延展到更高級的方向時,也會感覺容易很多。



3.一定要理論和實踐相結合

可以說,機器學習這門技術,是世界上理論與實踐結合最緊密的學科之一。實際上,整個計算機科學領域也都有這種共性。有的時候,大家會看到在一些網絡論壇上,很多人為了爭論理論吵得喋喋不休,但他們卻從來沒有真正動手做過項目,所有的討論都是空中樓閣;另外有些工程師,他們會非常熟練地使用各種工具,但是對背後的原理卻知之甚少。實際上這兩種狀態都不可取,只鑽研理論或者只關注應用,都會在將來影響大家的職業發展。


我的建議是,在學習的過程中,大家先對機器學習中的算法原理有一個大致的瞭解,然後再應用這個算法去解決一些實際問題,再反過來想一想還有沒有改進的空間。例如我為什麼要使用這個算法?是不是還有更適合這個問題的算法?這個參數是什麼意思?我該如何調節它等等。



害怕機器學習從入門到放棄?不妨看看這篇文章



4.試著自己動手寫一些算法

雖然現在有很多非常方便的機器學習建模工具,可以讓用戶甚至一行代碼都不用寫,就可以實現機器學習模型的訓練和部署,不過我還是建議大家不妨自己動手,用代碼來實現一些簡單的算法。這樣做會讓大家對算法有更深入的理解,如果日後工作中需要對某些算法進行改進,這樣的經驗會讓大家更加得心應手。



5.從統計學層面理解算法

有一部分從事機器學習職位的人,是從計算機科學領域轉過來的。而機器學習其實和統計學有著非常非常緊密的聯繫。同樣一個算法,從計算機科學的角度來進行解釋,與從統計學的角度進行解釋,是會有不同的說法。因此,從統計學的角度去理解機器學習算法,對大家非常有幫助。


6.多思考應用場景

有些朋友在學習過程中,很容易沉迷於工具或者是算法的使用,而忽視了應用場景的特點。實際上,機器學習能否起作用,或者說能夠產生價值,和應用場景的特點密切相關。換句話說,如果大家對業務場景不夠熟悉,不知道哪些數據對於結果有決定性作用,那麼即使訓練出來的模型可能也沒有實用的價值。這就成了一種捨本逐末的行為了。所以,一定要在準備數據的階段就深入思考業務場景,讓模型更具有使用價值。



7.不要相信炒作

現在很多媒體為了吸引眼球,都會誇大其詞。我們常常會看到一些如同科幻小說一樣的報道,還有一些文章不惜鼓吹人工智能的發展將會導致人類大規模失業。更有甚者,甚至提出駭人聽聞的威脅論,說人工智能未來會進化為超級物種,並且會與人類為敵,並在自身進化到一定地步便會統治人類、奴役人類。對於這樣的文章或是宣傳,大家不要當真。不管是人工智能還是機器學習,都是我們用來開展工作和學習的工具,但它也僅僅是各種工具中的一種而已,沒有必要把它看得太過於神奇,以平常心對待即可。



8.找到自己感興趣的項目

俗話說,羅馬不是一天建成的。機器學習也是如此,需要我們投入大量的精力和時間去鑽研。這個過程漫長且枯燥,非常容易讓初學者覺得無法堅持下去,以致於中途就放棄了。因此,找到自己感興趣的項目,可以幫助大家更好地堅持學習。例如你喜歡炒股,那就試試訓練一個預測股價的模型。或者你喜歡足球比賽,那麼可以試試用模型預測一下哪一隻隊伍會獲得冠軍,等等。切記,好的學習者一定懂得如何讓自己在學習過程中感到快樂。



9.記得鍛鍊身體

最後一點,也是最重要的一點。如果大家真的決定走上數據科學這條職業發展道路,那麼一定要養成鍛鍊身體的習慣。這個領域的工作強度很大,沒有好的體魄會讓你感到力不從心。另外,好的身材也會讓你的職業發展更加順利,畢竟,人們更喜歡風度翩翩的科學家。


害怕機器學習從入門到放棄?不妨看看這篇文章


以上就是我們給準備開始走上機器學習道路的朋友們的一些建議,希望能夠給大家一些參考。


分享到:


相關文章: