基本操作步驟
1、新建一個工作流(workflow)
2、從節點庫中選擇需要的節點(拖拽或者雙擊)
3、配置各節點參數,並連接各個節點
4、執行,查看各步驟中間結果
5、如何連接各個節點圖示
若需要,可導出不同格式的數據(csv,excel等)
1、新建一個工作流(workflow)
創建一個新的工作流,並命名。也可先創建一個工作流組(可簡單理解為一個文件夾而已),之後在該組內再創建各個工作流,方便管理工作流。如創建一個my_first_workflow後,則會在右側出現一個空的畫布,即主要的工作流編輯區
2、從節點庫中選擇需要的節點(拖拽或者雙擊)
3、配置各節點參數,並連接各個節點
- 配置文件的路徑
- 文件分隔符(軟件會自動識別,若識別不正確,可手動修改)
- 是否包含表頭,即是否有列名
若識別存在亂碼,可在Advanced再設置文件編碼格式,識別無誤後點擊OK即可
配置前後界面狀態的變化
- 紅色:未配置參數前有一個黃色感嘆號,提示需要配置參數才能執行
- 黃色:配置完成後節點狀態為黃色,即代表準備就緒,可以按F7執行(或右鍵點執行)
- 綠色:執行後的狀態為綠色,即代表執行完畢
4、執行,查看各步驟中間結果
執行成功後可以查看各個數據,與瀏覽Excel數據一樣,
還可以在2中查看不同數值類型的元數據
- 數值型數據的上下界
- 分類字符型的值
5、如何連接各個節點
按照鼠標左鍵連線,到下一個節點端口鬆開即可。連線後代表將一個節點的數據傳送到下一個節點,可簡單理解為數據管道,下一個節點再對上一個數據進行處理,而後可傳遞下一個節點。數據和參數的傳遞都是通過連線完成的
端口
各個節點的不同形狀端口代表不同對象,先簡單瞭解即可。
黑色三角:數據(最主要使用的,90%以上使用)
紅色圓圈:參數
方塊:模型,或數據庫需要配置的SQL語句等(注意各有顏色不同)
圖例說明
1)連線列過濾
2)執行後的結果