Python數據分析庫之pandas基本操作

pandas是什麼?

Python數據分析庫之pandas基本操作

是它嗎?

額。。。很顯然pandas沒有這個傢伙那麼可愛。。。

我們來看看pandas的官網是怎麼來定義自己的:

pandas is an open source, easy-to-use data structures and data analysis tools for the Python programming language.

很顯然,pandas是python的一個非常強大的數據分析庫!

讓我們來學習一下它吧!

Pandas是數據分析的核心工具包,它是基於Numpy構建的,可以理解為是為了數據分析而存在的,它擁有以下功能或者特點:

  • 一維數組Series+二維數組Dataframe
  • 可以直接讀取數據並做處理,非常高效簡單
  • 兼容各種數據庫
  • 支持各種分析算法

1.pandas序列

Python數據分析庫之pandas基本操作


Python數據分析庫之pandas基本操作

2.pandas數據結構DataFrame

DataFrame是一個【表格型】的數據結構,可以看做是【由Series組成的字典】(共用同一個索引)。DataFrame由按一定順序排列的多列數據組成。設計初衷是將Series的使用場景從一維拓展到多維。DataFrame既有行索引,也有列索引。

  • 行索引:index
  • 列索引:columns
  • 值:values(numpy的二維數組)
  • Python數據分析庫之pandas基本操作

    結果:

    Python數據分析庫之pandas基本操作

    默認情況下,如果不指定index參數和columns,那麼他們的值將從0開始的數字替代。

    Python數據分析庫之pandas基本操作

    結果:

    Python數據分析庫之pandas基本操作

    DataFrame屬性:values、columns、index、shape


    Python數據分析庫之pandas基本操作

    結果:

    Python數據分析庫之pandas基本操作


    後續小編會繼續更新更全的信息,請多多點贊轉發評論,你們的支持就是小編最大的動力。


    分享到:


    相關文章: