Pandas有四個重要數據對象:Series數據對象、DataFrame數據對象、索引數據對象以及時間序列數據對象
本文將介紹Pandas索引對象,主要內容如下:
Pandas索引對象
Pandas索引是基礎的數據對象,是組成Pandas其他數據對象重要部分,不能獨立存在:
- Dataframe對象,由索引對象 + N個數據序列組成,其中該索引對象又包括行索引對象和列索引對象
- Series對象,由索引對象 + 1個數據序列組成
- 時間序列對象,由索引對象 + 數據序列組成
索引對象存儲著基本信息有:軸名稱(x,y)和軸標籤
索引對象方法和屬性
列舉一些索引對象方法和屬性:
- append 將額外的索引對象追加到原索引後,產生新的索引
- difference 計算兩個索引的差集
- intersection 計算兩個索引的交集
- union 計算兩個索引的並集
- isin 計算表示每一個值是否在傳值容器中的布爾數組
- delete 將位置i的元素刪除,併產生新的索引
- drop 根據傳參刪除指定索引值,併產生新的索引
- insert 在位置i插入元素,併產生新的索引
- is_monotonic 如果索引序列遞增則返回True
- is_unique 如果索引序列唯一則返回True
- unique 計算索引的唯一值序列
索引重建
使用reidex方法重建對象索引,如果某個索引值不存在,則以缺失值補入
reindex方法參數:
- index 指定新索引的序列
- filrvalue 重建索引,使用替代值替代缺失值
- method 插值方式,ffill為前向填充,bfill是後向填充
變更行索引,列索引
檢查索引數據是否重複
索引對象中的索引數據是允許重複的
可通過索引對象的is_unique屬性用來判斷索引數據是否有重複
其中對有重複的索引數據對象進行索引選擇,會返回相同索引值對應的內容
最後
如果內容有誤,歡迎評論區指正!
喜歡我的朋友們,麻煩點一波關注,謝謝!