SPSS Modeler 數據整理之記錄處理

SPSS Modeler 數據整理之記錄處理

前面介紹了數據行處理中的記錄篩選,下面介紹關於行處理(記錄處理)的其他一些功能。

1. 數據排序

排序節點

SPSS Modeler 數據整理之記錄處理

案例:Demos文件下"catalog_seasfac.sav"的數據文件。實現數據流:

SPSS Modeler 數據整理之記錄處理

1.1 設置排序字段

SPSS Modeler 數據整理之記錄處理

1.2 結果

SPSS Modeler 數據整理之記錄處理

2. 數據區分

"區分"就是去重的意思,是去除數據中重複記錄,modeler中通過"區分"節點實現。

案例:

2.1 記錄完全相同情況

SPSS Modeler 數據整理之記錄處理

2.11 區分節點設置

SPSS Modeler 數據整理之記錄處理

SPSS Modeler 數據整理之記錄處理

2.12 結果

SPSS Modeler 數據整理之記錄處理

2.2 記錄不完全相同情況

SPSS Modeler 數據整理之記錄處理

如上圖,同一客戶ID、姓名,在不同時間註冊的時候填寫的年齡不同、學歷等級也不同,因此進行篩選前要定義篩選條件:

  • 1)年齡:選取最大值;
  • 2)銀行:合併多個值;
  • 3)債務:總和;
  • 4)學歷等級:取最高值。

2.21 區分節點設置設置選項卡:

SPSS Modeler 數據整理之記錄處理

組合選項卡:

SPSS Modeler 數據整理之記錄處理

SPSS Modeler 數據整理之記錄處理

SPSS Modeler 數據整理之記錄處理

2.22 結果

SPSS Modeler 數據整理之記錄處理

3. 數據彙總

在modeler中,數據彙總不僅僅包含SUM,還包括一些常用的統計值:合計、均值、最大、最小值、中位數、標準差、方差、四分位數等。通過"彙總"節點實現此功能。

案例:Demos文件下"telco.sav"的數據文件。

SPSS Modeler 數據整理之記錄處理

3.1 彙總節點設置

基本彙總:

SPSS Modeler 數據整理之記錄處理

結果:

SPSS Modeler 數據整理之記錄處理

彙總表達式:

對兩個或更多個字段做組合彙總,使用–彙總表達式實現。

SPSS Modeler 數據整理之記錄處理

結果:

SPSS Modeler 數據整理之記錄處理


分享到:


相關文章: