好书推荐|利用Python进行数据分析(附PDF及源码下载)

好书推荐|利用Python进行数据分析(附PDF及源码下载)

本书提供一份关于在Python下操作、处理、清洗、规整数据集的完整说明。本书第二版针对Python 3.6进行了更新,并增加实际案例向你展示如何高效地解决一系列数据分析问题。你将在阅读过程中学习到新版本的pandas、NumPy、IPython和Jupyter。 本书由Wes McKinney创作,他是Python pandas项目的创始人。

—文末附本书PDF下载地址—

本书简介

本书是对Python数据科学工具的实操化、现代化的介绍,非常适合刚学Python的数据分析师或刚学数据科学以及科学计算的Python编程者。数据文件和相关的材料可以在GitHub上找到:

使用IPython shell和Jupyter notebook进行探索性计算

学习NumPy(Numerical Python)的基础和高级特性

入门pandas库中的数据分析工具

使用灵活工具对数据进行载入、清洗、变换、合并和重塑

使用matplotlib创建富含信息的可视化

将pandas的groupby功能应用于对数据集的切片、分块和汇总

分析并操作规则和不规则的时间序列数据

利用完整的、详细的示例学习如何解决现实中数据分析问题

本书目录

前言

第1章 准备工作

1.1 本书内容

1.2 为何利用Python进行数据分析

1.3 重要的Python库

1.4 安装与设置

1.5 社区和会议

1.6 快速浏览本书

第2章 Python语言基础、IPython及Jupyter notebook

2.1 Python解释器

2.2 IPython基础

2.3 Python语言基础

第3章 内建数据结构、函数及文件

3.1 数据结构和序列

3.2 函数

3.3 文件与操作系统

3.4 本章小结

第4章 NumPy基础:数组与向量化计算

4.1 NumPy ndarray:多维数组对象

4.2 通用函数:快速的逐元素数组函数

4.3 使用数组进行面向数组编程

4.4 使用数组进行文件输入和输出

4.5 线性代数

4.6 伪随机数生成

4.7 示例:随机漫步

4.8 本章小结

第5章 pandas入门

5.1 pandas数据结构介绍

5.2 基本功能

5.3 描述性统计的概述与计算

5.4 本章小结

第6章 数据载入、存储及文件格式

6.1 文本格式数据的读写

6.2 二进制格式

6.3 与Web API交互

6.4 与数据库交互

6.5 本章小结

第7章 数据清洗与准备

7.1 处理缺失值

7.2 数据转换

7.3 字符串操作

7.4 本章小结

第8章 数据规整:连接、联合与重塑

8.1 分层索引

8.2 联合与合并数据集

8.3 重塑和透视

8.4 本章小结

第9章 绘图与可视化

9.1 简明matplotlib API入门

9.2 使用pandas和seaborn绘图

9.3 其他Python可视化工具

9.4 本章小结

第10章 数据聚合与分组操作

10.1 GroupBy机制

10.2 数据聚合

10.3 应用:通用拆分-应用-联合

10.4 数据透视表与交叉表

10.5 本章小结

第11章 时间序列

11.1 日期和时间数据的类型及工具

11.2 时间序列基础

11.3 日期范围、频率和移位

11.4 时区处理

11.5 时间区间和区间算术

11.6 重新采样与频率转换

11.7 移动窗口函数

11.8 本章小结

第12章 高阶pandas

12.1 分类数据

12.2 高阶GroupBy应用

12.3 方法链技术

12.4 本章小结

第13章 Python建模库介绍

13.1 pandas与建模代码的结合

13.2 使用Patsy创建模型描述

13.3 statsmodels介绍

13.4 scikit-learn介绍

13.5 继续你的教育

第14章 数据分析示例

14.1 从Bitly获取1.USA.gov数据

14.2 MovieLens 1M数据集

14.3 美国1880~2010年的婴儿名字

14.4 美国农业部食品数据库

14.5 2012年联邦选举委员会数据库

14.6 本章小结

附录A 高阶NumPy

附录B 更多IPython系统相关内容

后台私信回复关键字“pyda”即可获得本文书籍PDF版本。

注:本资料来源互联网,版权归该资源的合法拥有者所有。

—完—

关注微信公众平台“智慧坊”(微信号:intelliworkshop),获取更多原创文章及优质内容。


分享到:


相關文章: