伯克利學長揭祕統計學與其他學科之間聯繫

伯克利學長揭秘統計學與其他學科之間聯繫

背景介紹

分享人:Z學長

學校:北大數學

在讀:伯克利統計學碩士

講座內容

大學感悟及科研經驗分享

在大三的時候,在選擇專業和方向的過程中,我走了很多的彎路。當時沒有老師和長輩來指導我如何選專業,多數時候我都在閉門造車,憑空想象。那段時間心煩意亂,心思很難放在學習上。當我回過神來的時候,周圍的同學已經比我多學了很多。有的同學早早開始了本科生科研,有的同學已經提交了海外交換的申請。

真正想要向統計學方向發展,應該是我大三下學期的事情了。引領我走向這條路的,是我最最尊敬的吳老師。她是我本科生科研的導師,我的本科生科研做的是金融數學。記得那時,我和我的組員以正在以傳統的概率統計學工具來研究我們的題目,例如隨機模擬,隨機分析,假設檢驗等等。

在一次討論課的時候,吳老師提了一句:“要是用這些方法做下去,我覺得我們會舉步維艱,能不能將一些現代的統計學習方法運用到我們的研究上來呢?”之後,吳老師發給了我一本《The Elements of Statistical Learning》,她說這是伯克利的研究生教材,和我們的國內的統計學教材完全不一樣,從此一扇大門就打開了。就這樣,我自學了機器學習裡的基本理論、模型和方法。之後,我又學習了學院裡的《統計學習》這門課,從統計學習的民科變成了學院派。

所以,我這裡建議學弟學妹們都能夠儘早開始本科生科研。科研的方向不一定要十分合乎你的胃口,重要的是要和自己的導師多多交流,瞭解未來學科的發展方向,找到自己的學習目標。在我申請中最最遺憾的事情,就是沒有海外交流的經歷。因為海外交流需要我們大二的時候就要開始著手準備,等我反應過來的時候已經追回莫及。我的很多同學在海外交流期間,都得到了海外教授的那封價值連城的推薦信。

伯克利學長揭秘統計學與其他學科之間聯繫

機器學習的學習路線

數據科學是當下很時髦的名詞,如果能在PS裡呈現自己做的機器學習方面的相關工作,對於申請來將是一個很大的加分。在申請碩士,注重就業導向的統計碩士項目上,就很希望招來的學生有數據科學方面的背景。就我的經驗而言,學習Machine Learning(機器學習)需要在掌握理論知識的同時,同時訓練相應的編程技巧。

編程能力方面,做機器學習和深度學習的主流語言是C++和Python。但是,我希望學弟學妹們如果有時間的話,還是不要一上來就學Python,Matlab和R。因為這三門語言都過於“方便”和“靈活”,其掩蓋了編程最重要的東西—邏輯。我當時花了很長的時間學習C語言。C語言的“包”很少,一個簡單的矩陣操作就能把人難死,不過正是在這樣的糾結過程中,我對編程的理解逐漸深入,所以清晰的邏輯是編程的根本。當然了,如果之前有一定的編程基礎,那麼直接去學Python這些還是沒問題的。

伯克利學長揭秘統計學與其他學科之間聯繫

伯克利的學習及申請經驗

不論是來美國讀博士還是碩士,個人能力都是學術研究和找工作的關鍵。從本科高年級開始,就要開始注重自己能力的培養和提高。大家去搜搜Leetcode和Hacker rank,兩個都是Online Judge,編程練習的好地方,尤其是碩士項目,非!常!重!要!大家一定不能忽視。

關於學習方面,這裡我想強調兩點:

1. 把知識轉化為記憶:大學高年級階段,很多同學學習一門課就學一個星期,考完試之後就全部忘記了,這樣的做法是極不可取的。直到來美國,參加各種面試之後,才發現面試官問我的大學階段的東西很多都忘記了。學習一門課程之後,尤其是概率論、數理統計、隨機過程和迴歸分析,這四門課的基本理論、定理和運用都值得大家牢牢記住。

2.編程能力的培養:在美國,不論是課業還是面試,熟練的編程機巧能夠為你增光添彩。有些人認為,只有聰明的人才能把程序寫好,而我覺得這樣的理解是片面的。我認為編程更像當時初高中時的1000米測試,只要堅持不懈,就能練到爐火純青。因為編程和跑1000米一樣,是一個讓自己的身心不斷調整、不斷適應的過程。每天寫一小段程序,一個月之後你寫程序、Debug的速度就會有大的提高,再不會在寫Project的時候還在百度如何將int轉化為string之類的基本問題。

伯克利學長揭秘統計學與其他學科之間聯繫

生活部分

在美國的生活比想象中要難,所有大小事務都需要自己料理。週一到週五都在學校,週末在家自己做飯。在美國很少能有唱歌、打球、看電影之類的娛樂活動,最大的愛好就是做飯和鍛鍊。每每在微信裡和同學聊天,都會發現大家的廚藝都在飛速提高。

我這學期還在做助教,同時還要花費大量時間在Career Fair找實習上。對了,說一句,如果要做助教的話,口語一定要好。託福的口語一定要刷高一點,不然的話,你在這邊是當不了助教的。在國內學車感覺沒有必要,美國大多數州都需要重新考駕照。舊金山的公共交通比較發達,所以也不用擔心交通的問題。

問答環節

問:學長統計碩士和PhD出路有啥不同?有沒有必要讀PhD?

Z學長:我也在考慮這個問題,因為PhD在美國這邊是非常難畢業的,一般五年能準時畢業的人,都是非常牛的。如果你以後想工作的話,我覺得讀碩士已經足夠了,但是PhD的話會多一條出路。

問:學長可以介紹一些伯克利統計教授做機器學習的麼?

Z學長:伯克利做的最好的應該是Michael I. Jordan,是機器學習和深度學習的大牛;還有鬱老師,鬱彬老師做機器學習做的非常好;還有一位叫做Martin J. Wainwright,這位教授做機器學習也是大牛。

問:學長請問機器學習和統計到底什麼關係啊?是不是統計只是一種工具,機器學習是真正的研究方向?

Z學長:現在學術界也很難回答這個問題,因為這個問題真的很難,傳統統計像是貝葉斯統計,因果推斷之類的,他們不需要用到太多機器學習方面的東西,但是你做現代統計的話,像是做高維統計之類的,機器學習是必不可少的。

問:學長統計中的機器學習和EECS項目中的有什麼區別?

Z學長:現在統計中的機器學習和EECS中的差別已經越來越小了。統計基本上是從數學和理論的角度出發的,他會著重的講一些他的理論和模型部分,而EECS的話更注重於講他怎麼實現。

問:學長你好,如果只學了C和python,打算學習data science,還需要再學習java嗎?

Z學長:做data science的話不需要學習java,但是如果你要接觸一些並行計算等更高級的內容,java是需要的。

問:學長Linux在相關的學習和工作中有沒有什麼作用?

Z學長:Linux在實際學習和工作中非常有用,因為很多數據是要在服務器上跑的,那上面都是Linux的操作。你如果懂得Linux的操作和show的話,對你的工作和研究學習是非常有用的。但是工作面試中是不會考這方面的知識。

問:學長金融和機器學習差的挺遠的,你當時是怎麼想的呢?

Z學長:金融和機器學習,其實現在結合的比較緊密,如果你未來想做quant方面的,比如說做量化方面的工作的話,那麼金融和機器學習其實是結合起來的,在美國做quant的公司,很希望招的員工能有機器學習的背景。


分享到:


相關文章: