100天搞定機器學習|day45-53 推薦豆瓣9.3:Python數據科學手冊

100天搞定機器學習|day45-53 推薦豆瓣9.3:Python數據科學手冊

《Python數據科學手冊》共五章,每章介紹一到兩個Python數據科學中的重點工具包。首先從IPython和Jupyter開始,它們提供了數據科學家需要的計算環境;第2章講解能提供ndarray對象的NumPy,它可以用Python高效地存儲和操作大型數組;第3章主要涉及提供DataFrame對象的Pandas,它可以用Python高效地存儲和操作帶標籤的/列式數據;第4章的主角是Matplotlib,它為Python提供了許多數據可視化功能;第5章以Scikit-Learn為主,這個程序庫為最重要的機器學習算法提供了高效整潔的Python版實現。

本書主要框架:

第2章:NumPy介紹

2.1 理解Python中的數據類型

2.2 NumPy數組基礎

2.3 NumPy數組的計算:通用函數

2.4 聚合:最小值、最大值和其他值

2.5 數組的計算:廣播

2.6 比較、掩碼和布爾運算

2.7 花哨的索引

2.8 數組的排序

2.9 結構化數據:NumPy的結構化數組

3 Pandas數據處理

3.1 Pandas對象簡介

3.2 數據取值與選擇

3.3 Pandas數值運算方法

3.4 處理缺失值

3.5 層級索引

3.6 合併數據集:ConCat和Append方法

3.7 合併數據集:合併與連接

3.8 累計與分組

3.9 數據透視表

3.10 向量化字符串操作

3.11 處理時間序列

3.12 高性能Pandas:eval()與query()

4 Matplotlib數據可視化

4.1 簡易線形圖

4.2 簡易散點圖

4.3 可視化異常處理

4.4 密度圖與等高線圖

4.5 直方圖

4.6 配置圖例

4.7 配置顏色條

4.8 多子圖

4.9 文字與註釋

4.10 畫三維圖

中文版下載地址:

https://github.com/MachineLearning100/100-Days-Of-ML-Code/blob/master/Other%20Docs/Python數據科學手冊.zip

代碼及案例:

https://github.com/jakevdp/PythonDataScienceHandbook


分享到:


相關文章: