寫給統計專業的學弟學妹們(2)——選擇統計專業後的若干問題

說明:這是2014年我發在人大經濟論壇上的一組文章。上次回母校分享學習經驗。回頭讀了一些,發覺有點意思。所以拿出來在頭條上發出來。希望同行能多多批評指正。有任何問題可以私聊。當然也可以加我的公眾號私聊:Gjc_ccnu

對於剛進入統計專業的新人,也許會有很多和我當年一樣的困惑,下面我把這些我能想到的困惑和我自認為正確的解答列舉如下:

1. 統計到底是什麼?是統計局乾的統計嗎?

統計學是一門有效收集數據、整理數據、分析數據以支持科學決策的學科。至於是不是統計局乾的統計,這個事情要這麼看,國外的統計局乾的統計實際上的統計學理論一個很重要的應用。國內理論上也應該是這樣。

2.統計和數學有關係嗎?

我個人是這樣看的,數據的確為統計提供了很多理論工具。但也有明顯不同:

(1)數學學科一般都要強調數學,比如應用數學、理論數學。統計學一般要加上統計學。比如數理統計、經濟統計

(2) 國外一般都有兩個統計系,一個叫統計系,一個叫生物統計系。一般不放在數學系下面。國內很多學校比如人大教統計學院、上海財大叫管理與統計學院、華東師統計學院,統計專業和數學專業也沒放在一起。所以你會發現有些學校統計專業的開出的課程除數學分析、高代、概率論、數理統計其餘的跟數學相關的課程基本上沒有。

(3) 從上面也可以看出,統計實際可以跟很多應用非常強的學科結合在一塊,比如管理、金融、營銷等。可以說統計是一種實踐性非常強的工具。數學往往並不具備這樣的功能。所以從事統計學術工作者往往除了玩統計之外,往往會弄弄除統計之外的副業,比如生物統計、生物信息學、化學計量、經濟計量等。因為這些學科裡面有大量需要統計區去解決的問題。

本質上的區別主要有如下幾點:

(1) 研究的目的不同:統計學理論研究主要是根據實際的問題和困難提出創新的數據處理方法、模型和算法,比較容易落到實處。數學通常研究的是一些比較理論的框架;

(2)研究的對象不同:統計學研究的根本對象是具體問題抽象出的數據。數學則研究的是抽象的空間和數量關係;

(3)思考的邏輯不同:統計更傾向於一種歸納邏輯,很多統計問題,很難像數學一樣給出一個定理性的證明。數學更傾向於一種演繹邏輯。

(4) 另外研究的手法不同,統計更傾向於使用基於數據的實證的方法

3. 統計學專業和概率論與數理統計專業有什麼關係?

呵呵,這個問題,我想說如下幾點我的理解:

(1) 這個問題我當年讀本科的時候特別糾結,讀研究生的時候就更糾結。因為很多人不理解有什麼區別,每次都需要我去普及一些常識;

(2) 依照國內的分專業原則統計學更偏向於應用,主要指的是經濟統計,概率論與數理統計則偏向於統計理論方法的研究。這種區分方法感覺特別彆扭。但是實在沒有什麼辦法。這可能跟中國統計應用的場景比較單一,學術研究的經費來源渠道非常有限有關。因為這個學科在當時能發揮的價值還很有限,所以都需要找一個比較強勢一點的學科做靠山。應用統計就找了經濟做靠山,簡稱統計學,數理統計就找了概率論做靠山。所以就有了這種特別扯淡的區分;

(3)還有一個比較奇特的現象,就是這樣區別對待,給大家創造了一個可以相互鄙視的機會和理由。做應用的覺得做理論沒什麼實用價值,做理論覺得做應用的比較淺薄。這個一方面說明,在中國對這個問題的認識還比較混亂,沒有形成相對比較統一的認識,統計科學的發展還非常落後;另外一方面也說明中國統計界能做出理論和應用完美結合的成果實在太少。實際在統計很發達的歐美國家,大家沒有刻意這麼去區分。做應用的執著於用統計方法去解決實際問題,做理論也會根據實際問題去不斷創新方法和理論。

4.統計是熱門專業嗎?

同學你問這個問題,說明你對目前的行情實在不怎麼了解。據我瞭解的單位招聘情況、 我找工作及周圍人找工作的情況來看,統計專業絕對算目前的熱門專業。我覺得主要有如下幾個原因導致這個專業目前相當熱門:

(1) 統計天生就和數據分析就是夫妻,這個沒辦法,因為數據分析中用到的原理、思想和方法基本上來自統計。我個人其實建議將統計專業改成數據分析專業好了。實際上統計學的大師級人物圖基在1962年就曾在統計學最頂尖的刊物《annals of statistics》發表過一遍《the future of data analysis》文章提過這個問題。還在這篇文章中提出了著名的“探索性數據分析”的理念;

(2)現在大部分企業尤其是互聯網企業獲取數據的成本已經很低,這為數據分析有源源不斷的原材料數據提供了保障;

(3)企業的競爭環境越來激烈,所以量化管理和決策的思想也越來越受到企業的重視,基於數據的決策也越來越多被應用於企業

(4)多年來,尤其是近5年來互聯網、電信企業對於數據分析的重視讓數據分析這個行業已慢慢成熟起來

在考研的時候統計也是非常熱門的專業,主要原因是從學術的角度看統計學於很多學科都有這天然的深刻的聯繫,比如:

(1)機器學習、模式識別這樣學科的很多方法和理念都來和統計學一致。當然從這些學科發展也為統計提供了很好的養分;

(2)計量經濟學和金融計量學裡面的分析方法和時間序列的分析方法一致。

(3) 還有生物統計,實際數理統計學的很多理論基本上都來自pearson、fisher等對生物遺傳學研究的總結

(4)化學計量、心理計量學、信息計量學等等一些學科應用的方法也都來自於統計學。

可以說只要有數據的地方、有不確定性的地方就會有統計的身影。

正是基於以上商業應用和學術應用上的需要,目前在國內統計應該說已經成為當之無愧的熱門學科了。當然話說回來了,正是統計學和其它學科的廣泛聯繫,我們在找工作時也不得不面臨這些專業的學生競爭。所以我們應該以數據挖掘和大統計的視角來學習統計。

5. 一般哪些企業會招聘統計相關專業的畢業生?

主要有如下一些行業的企業會招聘統計專業的畢業生:

(1)金融證券行業,這個行業裡面會有兩個職位和統計比較契合,一個是證券研究員、一個是金融工程師,這個行業薪資普遍都比較高。

(2)銀行業:這個行業裡面風險管理和信用評分之類的職位與統計比較契合。這個行業裡面的職位薪資也還不錯

(3) 互聯網:這個行業裡面數據分析師和數據挖掘工程師的職位與統計比較契合這個行業平均薪資還行

(4)諮詢行業:這個行業裡面諮詢顧問和數據分析師這兩個職位和統計比較契合這個行業裡面薪資都還不錯

(4) 電信業:這個行業裡面也大量招聘數據分析師和數據挖掘工程師,薪資也不錯

(5)生物醫藥行業:這個行業最近幾年招人比較多。而且嚴格要求會SAS、有統計專業背景,薪資也相當誘人

6. 薪資怎麼樣?

一線城市北上廣深應屆本科大概在4000-10000左右。應屆碩士大概在10000-20000左右。至於後面要看個人能力和努力程度。二線除城市這種需求相對會少些。

7. 做數據分析相關的工作具體需要學習哪些知識呢?

主要要具備如下一些知識:

專業技能:excel、sql、sas、python或者R,這個必須相當熟練,最好PPT也玩的非常不錯。如果能玩spark,會用hive,那就更好了。如果再能懂點C和java,會實現算法。那就非常完美了

專業理論:線性模型、logistic模型、時間序列模型、多元分析、數據挖掘算法。學這些主要要弄清楚想法、算法原理、用法及優缺點

通用能力:結構化的思考能力、溝通能力和表達能力

8. 我對統計非常感興趣,關於怎麼學習統計你能給一些建議嗎?

這個統計系的老師們比我更專業。所以多聽一下他們的意見和建議。我個人覺得這個看你未來是想做學術型的工作還是想到企業工作。

如果是學術型相關工作的話,要做好如下幾點:

(1)重點打好概率論和數理統計的理論基礎;

(2) 要注重各種模型及算法的學習;

(3)學好Python或者R,會做各種統計試驗,我個人覺得統計目前的發展對於模擬數據試驗的依賴性還是蠻強的

(4)選定一個具體的問題,去深入研究一下。多讀一下一流統計刊物上的文章。一般真正讀懂一兩篇可能就會有很多新的想法

如果是到企業,要做好以下幾點:

(1)要注重各種模型及算法的學習,注意各種方法的適用範圍;

(2)學好Python,能用Python實現完整的數據挖掘流程;

(3)可以到kaggle上面去下載幾個企業實際的數據挖掘項目,完整的去做一下,並不斷的去優化;

9) 數據分析師在企業大概要做哪些工作?

首先說一下企業數據中心的簡單架構。一般來數據中心主要分六大模塊:

(1) 數據平臺:負責搭建和維護採集數據、數據倉庫、ETL、數據報表相關IT體系

(2) ETL:主要是把業務上產生的不怎麼幹淨和規範的數據轉換為需要的數據;

(3) BI報表:主要是根據業務的分析框架和需求上基於數據倉庫去開發一個報表系統

(4)數據分析和挖掘:主要針對一些具體的項目的執行,比如從數據倉庫裡面提個數據、比如分析最近短信量下降的原因,比如做個遊戲道具的定價、比如做個用戶的流失預警

(5)數據產品:主要是針對某些固定的挖掘需求系統化的開發一些產品。CRM、精準營銷系統

(6)行業分析:主要做一些用戶的調研分析及競爭對手的分析

數據分析師主要做C、D、E三塊相關的工作。具體主要做的事情有用SQL提取數據和整理數據、用EXCEL做一些簡單的數據處理和分析、用SAS做一些模型、用PPT做一些報告、用JAVA或者C等做一些算法上的開發等等

另外數據分析通常會常伴管理層左右,所以最好知識能夠全面一點,最好能懂點管理、營銷,最好能用業務語言表達分析的結果。這樣升遷會比較快。

10) 我對統計有初步瞭解了,但是我實在不怎麼喜歡,我該怎麼辦?

建議先弄明白自己真的是不喜歡嗎,自己不喜歡統計的原因是什麼,再想想不喜歡這個到底喜歡什麼。如果弄清楚了真正喜歡的東西,轉系我覺得也可行。當然實在弄不清楚。建議先適應一階段。有句話叫日久生情。當然如果實在生不了情,那就應付吧。但是始終還是要找件自己喜歡的有出路的事情來做——我喜歡玩遊戲,能不能就以這個為職業——當然如果有門路能堅持當然是可以的。前提當然還是要把每門功課弄及格。我記得我們這屆有一個非常成功案例,具體名字我就不說了。這兄弟實在不怎麼喜歡統計。但別人喜歡寫程序,而且喜歡英語。這兄弟其它的東西就應付著,重點做他喜歡的事情。後面進了一家小的外企。工作三年之後,跳到成都IBM做DBA,日子也過的很逍遙。實際還有兩個兄弟跟這個情況也很類似。總之無論如何要找到自己的興趣點。學一點能在未來用得著的真本事。這個上帝會想辦法給你回報的。



分享到:


相關文章: