前面介紹了數據行處理中的記錄篩選,下面介紹關於行處理(記錄處理)的其他一些功能。
1. 數據排序
排序節點
案例:Demos文件下"catalog_seasfac.sav"的數據文件。實現數據流:
1.1 設置排序字段
1.2 結果
2. 數據區分
"區分"就是去重的意思,是去除數據中重複記錄,modeler中通過"區分"節點實現。
案例:
2.1 記錄完全相同情況
2.11 區分節點設置
2.12 結果
2.2 記錄不完全相同情況
如上圖,同一客戶ID、姓名,在不同時間註冊的時候填寫的年齡不同、學歷等級也不同,因此進行篩選前要定義篩選條件:
- 1)年齡:選取最大值;
- 2)銀行:合併多個值;
- 3)債務:總和;
- 4)學歷等級:取最高值。
2.21 區分節點設置設置選項卡:
組合選項卡:
2.22 結果
3. 數據彙總
在modeler中,數據彙總不僅僅包含SUM,還包括一些常用的統計值:合計、均值、最大、最小值、中位數、標準差、方差、四分位數等。通過"彙總"節點實現此功能。
案例:Demos文件下"telco.sav"的數據文件。
3.1 彙總節點設置
基本彙總:
結果:
彙總表達式:
對兩個或更多個字段做組合彙總,使用–彙總表達式實現。
結果: