Python是一種面向對象、直譯式計算機程序設計語言,由Guido van Rossum於1989年底發明。由於他簡單、易學、免費開源、可移植性、可擴展性等特點,Python又被稱之為膠水語言。下圖為主要程序語言近年來的流行趨勢,Python受歡迎程度扶搖直上。加vx:tanzhouyiwan免費獲取學習資料。
由於Python擁有非常豐富的庫,使其在數據分析領域也有廣泛的應用。由於Python本身有十分廣泛的應用,本期Python數據分析路線圖主要從數據分析從業人員的角度講述Python數據分析路線圖。整個路線圖計劃分成16周,120天左右。主要學習內容包括四大部分:
1)Python工作環境及基礎語法知識瞭解(包括正則表達式相關知識學習);
2)數據採集相關知識(python爬蟲相關知識);
3)數據分析學習;
4)數據可視化學習。
Python工作環境及基礎語法知識瞭解
對於Python基礎語法學習部分,學習週期大概為4周,需要的相關資源在網絡上都能找到免費的資源,而且質量都不錯。相關中文資源如下:
1.python工作集成環境包
Python(x,y):下載地址
Pycharm:下載地址
2.python數據分析相關庫(Pandas/ Numpy/
Scipy/ Matplotlib)
如果安裝了上面集成工作包,則下面的包不需要重新安裝了。關於包的安裝方法在學習資源圖書中都有介紹,通常安裝庫採用pip方法,也可以用pip list查詢系統安裝了哪些庫。
3.學習資源
圖書:1)Python基礎教程(第2版)[電子版圖書自行百度]
2)深入淺出Head First python(中文版)[電子版圖書自行百度]
在線教程:1)廖雪峰的python教程
2)正則式學習
視頻教程:1)慕課網python入門
2)慕課網python進階
3)正則式學習視頻
數據採集學習
對於數據採集部分的學習主要是通過python爬蟲的學習瞭解基本的外部數據採集情況,當然也可以藉助別人寫好的規則庫直接完成某些數據的採集。這部分內容的學習週期大概也為四周,需要的相關資源在網絡上都能找到免費的資源,而且質量都不錯。相關中文資源如下:
爬蟲學習在線教程:
1.Python爬蟲入門一之綜述
2.Python爬蟲入門二之爬蟲基礎瞭解
3.Python爬蟲入門三之Urllib庫的基本使用
4.Python爬蟲入門四之Urllib庫的高級用法
5.Python爬蟲入門五之URLError異常處理
6.Python爬蟲入門六之Cookie的使用
7.Python爬蟲入門七之正則表達式
8.Python爬蟲實戰一之爬取糗事百科段子
9.Python爬蟲實戰二之爬取百度貼吧帖子
10.Python爬蟲實戰三之計算大學本學期績點
11.Python爬蟲實戰四之抓取淘寶MM照片
12.Python爬蟲進階一之爬蟲框架Scrapy安裝配置
視頻教程:Python簡單爬蟲開發
數據分析
Python數據分析的學習主要是對相關庫的使用,比如數據整理需要用到numpy和pandas庫,數據描述與分析分析則主要用到pandas庫,從某種程度上講,利用python進行數據分析的學習過程就是對庫的學習過程。由於有了前面2部分內容的學習基礎,本部分內容的建議學習練習時間也為4周,相關免費學習資源如下:
圖書:利用python進行數據分析[電子版圖書自行百度]
視頻:用python玩轉數據[視頻為cousera認證課程,全程中文]
數據可視化
Python數據可視化學習的過程就是學習matplotlib庫的過程,matplotlib庫包含有豐富的數據可視化資源,地圖、3D等等都有涉及,如果有前面3部分的學習經驗的話,這部分內容在4周內也能解決。相關中文學習資源如下:
圖書:Python數據可視化編程實戰[電子版圖書自行百度]
在線教程:
1.利用Python繪圖和可視化(1)
2.利用Python繪圖和可視化(2)
至此,Python數據分析相關學習內容介紹完了,上面介紹的多種資源,每個階段只需選擇其中的一種進行深入即可,更多更深的內容則需要自己去實踐摸索。更多數據分析學習及數據分析工具參見數據導航網站。
加微信:tanzhouyiwan免費獲取Python學習資料
閱讀更多 sxyyw 的文章