互聯網+時代,大家是不是多少對“機器學習”、“數據分析師”等各種高大上的職位充滿好奇與憧憬?總想要跟上時代潮流、學習一把呢?但數據分析相關書籍琳琅滿目,如果全部看一遍,估計不吃不喝也要看好多年吧……
今天我們就請來了諮詢與數據分析部的菜(dà)鳥(shén)數據分析師小L,讓她結合自身經歷,為大家推薦數據分析師入門讀物,快點一起來充電吧!!!
其實關於如何入門數據分析師,網上不乏各路大牛的推薦啦!但作為菜鳥,小L覺得自己更能體會初學者的心情,可以充分避開那些“好難懂”、“公式好多”的教科書,列出自家推薦的9本入門書籍與3個在線課程,拍胸脯保證全都非常基礎。
溫馨提示
根據經驗統計,全部學習完大約需要100小時。也就是說,如果每天學習8小時,兩週以內就能搞定!就算是像小編這樣比較懶的,每天只學1~2小時,3個月內也能學完啦~
首先看看,數據分析師需要具備哪些技能呢?
如下圖所示,不同的職業定位對各個技能點的側重會有所不同,但大致可分為以下幾種主要技能,我將會按照這個區分來分別推薦書單。
· 數學/統計學
· 業務知識
· 編程技能
· 機器學習
· 分析工具
數學/統計學
在剛開始學習的時候,只需要記住最常用的一些統計學概念即可~
《深入淺出數據分析》
難度:★☆☆☆☆
預估時間:3小時
非常輕鬆愉快的書,簡單得像看圖說話。可以簡單瞭解數學上的各種抽象概念,比如假設檢驗、貝葉斯統計等,作為第一本入門書籍再適合不過了。書裡還記錄了一些excel和R的函數。
《數學之美》
難度:★★★☆☆
預估時間:5小時
主要講自然語言處理和信息處理技術。小L第一次讀是本科的時候,感覺像是讀小說一樣精彩,精彩到碩士毫不猶豫選了自然語言處理方向,足見其魅力之大。後來為了打基礎,重新看了兩三遍,依舊常讀常新。作為擴寬視野是一本非常棒的讀物。
《統計思維》
難度:★★★★☆
預估時間:6小時
較前兩者而言,稍微“難啃”了一點,但統計學的乾貨很多。書中用商務上遇到的各種實際案例來解釋迴歸分析、因子分析等常用統計學方法,也依舊非常引人入勝。
相似推薦:
《看穿一切數字的統計學》
《數據之美》
《精益數據分析》
業務知識
《信用評分模型技術與應用》
難度:★★☆☆☆
預估時間:3小時
這是小L剛成為信用卡從業人員時的讀物。國內信用卡相關的參考書不多,推薦先看作者的另一本《現代信用卡管理》作為入門讀物,系統地瞭解信用卡知識後再看這本。與前一本有重複的內容,但在評分模型的介紹上詳細了一些。
相似推薦:國內信用卡較權威的資料實在不多,強推一下咱家的銀數觀卡公眾號!
編程技能
Codecademy(Python)
難度:★★☆☆☆
預估時間:15小時
Codecademy是一個基於網絡的互動編程教學網站。這個網站最重要的功能就是可以在上面直接寫程序,然後根據網站的反饋學習。小L在零編程基礎的時候,就在上面“玩會”了Python。國內類似的網站有慕課網。
《笨方法學Python》
難度:★★★☆☆
預估時間:10小時
通過上面網頁的交互式學習,還需要補一補系統的基礎知識。這本書的作者很有態度,要求讀者在開始編程的時候,一定要自己一點一點地敲代碼。最後自己設計了一個小遊戲,還是很有成就感的。
《SQL必知必會》
難度:★★☆☆☆
預估時間:3小時
當數據量變大時,僅用Excel是不夠的,需要使用數據庫。雖然不同的數據庫語法會有些許差異,這本書基本覆蓋了SQL的基礎功能和語法。看完後推薦網上搜SQL習題,關於學生、老師、課程和成績的經典習題大概60道,寫一遍差不多就能掌握各種基礎操作了~
相似推薦:
廖雪峰的Python教程
W3school的SQL教程
《The Little SAS Book》
《深入解析SAS》
機器學習
Coursera(Machine Learning)
難度:★★★★☆
預估時間:30小時
這個機器學習課程算是赫赫有名,介紹的算法也都是基本而常用的,如邏輯斯蒂迴歸、協同過濾等,公式的推理簡單易懂。推薦以2倍的速度觀看視頻,做習題時遇到不懂的再重看對應的片段,這樣效率很高。用類似MATLAB的Octave編程,學完後可以試試把代碼移植到Python上。
《機器學習實戰》
難度:★★★☆☆
預估時間:15小時
更多的應用案例,同樣基於Python。上邊的網課會講解怎麼實現基本方法,這本書會告訴你Python有哪些包可以直接調用。因為幾乎不需要自己考慮解決方法,把這本書按順序走一遍也挺輕鬆愉快的。
相似推薦:
《統計機器學習》
《機器學習》(周志華)
《利用Python進行數據分析》
《數據科學實戰》
分析工具
工作中遇到的一些數據分析任務,也可以通過一些不需要編程的工具來完成~
《誰說菜鳥不會數據分析》
難度:★★☆☆☆
預估時間:4小時
Excel在處理較小數據集的時候是十分強大的工具。這本書以對話的形式介紹了Excel的各種基礎用法,尤其是VLOOKUP和數據透視表的部分,小L可是做了滿滿兩頁的筆記呢。
《和秋葉一起學PPT》
難度:★★☆☆☆
預估時間:3小時
在商業上,如何呈現數據是重頭戲。這本書詳細介紹了Powerpoint的各種功能,對於小白來說值得一讀。小L最大的收穫是可以熟練使用ctrl+G~
Web scraper
難度:★★☆☆☆
預估時間:3小時
巧婦難為無米之炊,有些任務要求自己收集數據。Web scraper是Chrome瀏覽器的一款插件,用於爬蟲,不需要編程基礎。網上有很多教程,通過簡單操作就可以抓取不同元素、圖片和翻頁內容。
相似推薦:
Echarts 開源的可視化工具
寫在後面
有人會說,簡單的書看一本就可以了。小L認為,雖然不可以一直拘泥於基礎,但簡單的書讀多幾遍印象深刻後其實能應對實際工作中的很多問題。查理·芒格說過:記住淺顯的好過掌握深奧的。
學習如何成為數據分析師或其它職業,都首先得有一個開始,讓自己參與進去、主動思考、培養解決問題的能力,那麼以後遇到問題時,才能越來越熟練地自己想辦法解決。
閱讀更多 戰略諮詢金志勇 的文章