6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

【必知必会1】python官网

python官网地址:https://www.python.org/

6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

python官网是学习python的一个重要学习资源,它提供了不同系统的不同版本的python安装包,python2.X和python3.X都可以在这里进行获取(目前python官网已只更新python3.X版本的安装包),无论你所使用的系统是什么。同时,提供了python社区,社区活跃度很高,为大家提供了丰富的案例和答疑解惑。

6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

python官网一个重要的资源就是python技术文档,里面包含了python完整的使用方法,是python重要的财富之一。除此之外,还提供了python语法更新的及时通知、python新闻和一些重要的事件等。更多内容,大家可以访问python官网进行学习以及宝藏的挖掘。

【必知必会2】Numpy官网

Numpy官网地址:https://numpy.org/#

6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

Numpy(Numerical Python的简称)是高性能科学计算和数据分析的基础包。

  • ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。
  • 用于对整组进行快速运算的标准数学函数(无需编写循环)。
  • 用于读写磁盘数据的工具以及用于操作内存映射文件的工具。
  • 线性代数、随机数生成以及傅里叶变换功能。
  • 用于集成由C、C++、Fortran等语言编写的代码的工具。

数据分析主要关注的功能:

  • 用于数据整理和清理、子集构造和过滤、转换等快速的矢量化数组运算。
  • 常用的数组算法,如排序、唯一化、集合运算等等。
  • 高效的描述统计和数据聚合/摘要运算。
  • 用于异构数据集的合并/连接运算的数据对齐和关系型数据运算。
  • 将条件逻辑表达为数组表达式(而不是带有if-elif-else分支的循环)。
  • 数据的分组运算(聚合、转换、函数应用等)。

NumPy官网提供了如上关于numpy的定位介绍,以及如何开始使用numpy、技术文档以及numpy的合作伙伴。numpy在基于数组对象的计算能力上是一个重要的应用,特别是我们在进行数据处理与计算过程中,该计算包则会有较大的发展空间。

【必知必会3】Pandas官网

Pandas官网地址:https://pandas.pydata.org/

6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

panda是一个开源的、bsd许可的库,为Python编程语言提供高性能、易于使用的数据结构和数据分析工具。

熊猫是NumFOCUS赞助的项目。这将有助于确保作为一个世界级的开放源代码项目的panda的成功开发,并使捐赠该项目成为可能。

pandas是基于NumPy构建的,让以NumPy为中心的应用变得更加简单。

具备的功能:

  1. 具备按轴自动或显式数据对齐功能的数据结构。
  2. 集成时间序列功能。
  3. 既能处理时间序列数据也能处理非时间序列数据的数据结构。
  4. 数学运算和约简(比如对某个轴求和)可以根据不同的元数据(轴数据)执行。
  5. 灵活处理缺失数据。
  6. 合并及其他出现在常见数据库(例如基于SQL)中的关系型运算。

Pandas引入约定:

from pandas import Series,DataFrame

import pandas as pd


【必知必会4】Matplotlib官网

Matplotlib官网地址:https://matplotlib.org/

6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

matplotlib是一个用于创建出版质量图表的桌面绘图包(主要是2D方面)。如果结合使用一种GUI工具包(如IPython),matplotlib还具有诸如缩放和平移等交互功能。它不仅支持各种操作系统上许多不同的GUI后端,而且还能将图片导出为各种常见的矢量和光栅图:PDF、SVG、JPG、PNG、BMP、GIF等。

matplotlib还有许多插件工具集,如用于3D图形的mplot3d以及用于地图和投影的basemap。

matplotlib API函数(如plot和close)都位于matplotlib.pyplot模块中,其通常的引入约定是:

import matplotlib.pyplot as plt

虽然pandas的绘图函数能够处理许多普通的绘图任务,但如果需要自定义一些高级功能的话就必须学习matplotlib API。

【必知必会5】scikit-learn官网

scikit-learn官网地址:https://scikit-learn.org/stable/

6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

scikit-learn官网是机器学习的重要学习的资源网站。scikit-learn打造自身的特点如下:

  • 简单而有效的预测数据分析工具
  • 对每个人都可访问,并可在各种上下文中重用
  • 构建在NumPy、SciPy和matplotlib上
  • 开源,商业使用- BSD许可证
6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

官网上提供了众多的机器学习方法,比如:分类、回归、聚类、降维、模型选择、预测等。每一类方法中的具体算法应用以及适用的场景,大家可以到官网上进行相应的学习。

【必知必会6】TensoFlow官网

TensoFlow官网地址:https://tensorflow.google.cn/

6大python学习资源,完整掌握“数据处理-分析-可视化-挖掘”

TensorFlow 是一个端到端开源机器学习平台。它拥有一个包含各种工具、库和社区资源的全面灵活生态系统,可以让研究人员推动机器学习领域的先进技术的发展,并让开发者轻松地构建和部署由机器学习提供支持的应用。使用TensorFlow平台,可以轻松地构建模型、随时随地进行可靠地机器学习生成和强大的研究实验。更多关于TensorFlow的介绍,可以进一步学习。


分享到:


相關文章: