使用Pandas進行數據處理,瞭解Pandas索引對象

Pandas有四個重要數據對象:Series數據對象、DataFrame數據對象、索引數據對象以及時間序列數據對象

本文將介紹Pandas索引對象,主要內容如下:

使用Pandas進行數據處理,瞭解Pandas索引對象

Pandas索引對象

Pandas索引是基礎的數據對象,是組成Pandas其他數據對象重要部分,不能獨立存在:

  1. Dataframe對象,由索引對象 + N個數據序列組成,其中該索引對象又包括行索引對象和列索引對象
  2. Series對象,由索引對象 + 1個數據序列組成
  3. 時間序列對象,由索引對象 + 數據序列組成
使用Pandas進行數據處理,瞭解Pandas索引對象

索引對象存儲著基本信息有:軸名稱(x,y)軸標籤

索引對象方法和屬性

列舉一些索引對象方法和屬性

  1. append 將額外的索引對象追加到原索引後,產生新的索引
  2. difference 計算兩個索引的差集
  3. intersection 計算兩個索引的交集
  4. union 計算兩個索引的並集
  5. isin 計算表示每一個值是否在傳值容器中的布爾數組
  6. delete 將位置i的元素刪除,併產生新的索引
  7. drop 根據傳參刪除指定索引值,併產生新的索引
  8. insert 在位置i插入元素,併產生新的索引
  9. is_monotonic 如果索引序列遞增則返回True
  10. is_unique 如果索引序列唯一則返回True
  11. unique 計算索引的唯一值序列

索引重建

使用reidex方法重建對象索引,如果某個索引值不存在,則以缺失值補入

reindex方法參數:

  • index 指定新索引的序列
  • filrvalue 重建索引,使用替代值替代缺失值
  • method 插值方式,ffill為前向填充,bfill是後向填充
使用Pandas進行數據處理,瞭解Pandas索引對象

變更行索引,列索引

使用Pandas進行數據處理,瞭解Pandas索引對象

檢查索引數據是否重複

索引對象中的索引數據是允許重複的

可通過索引對象的is_unique屬性用來判斷索引數據是否有重複

使用Pandas進行數據處理,瞭解Pandas索引對象

其中對有重複的索引數據對象進行索引選擇,會返回相同索引值對應的內容

最後

如果內容有誤,歡迎評論區指正!

喜歡我的朋友們,麻煩點一波關注,謝謝!


分享到:


相關文章: