《主數據驅動的數據治理》
王兆君、王鉞、曹超輝 編著
清華大學出版社,2019年4月版
全書四篇14章,358頁
第4章 主數據項目的準備
主數據實施過程中的主要風險包括組織管理風險、數據質量風險、數據轉換風險、系統集成風險等四個方面。
項目初期組織管理風險較為突出,項目建設過程中,其他風險較為突出。
組織管理風險
缺少組織風險的控制,將導致嚴重問題
- 滯後,不能如期完工
- 失控,成本上升
- 焦慮,項目團隊凝聚力下降
- 流失,項目管理團隊不穩定
首先,建立健全的項目管理組織,這是項目成功的基礎。
其次,需要公司高層領導的高度重視,推動跨部門協作,是項目成功的關鍵。
數據質量風險
數據質量主要體現在:
- 是否準確,與假定正確值是否一致
- 是否完整,必要屬性中是否有缺失
- 是否一致,是否滿足已有的約束條件
- 是否唯一,記錄(或碼值)是否有重複
- 是否有效,是否滿足分類準則的要求
數據清洗是提高數據質量的最重要環節,主要包括確認輸入數據、修改錯誤值、保證數據值落入定義域、消除冗餘數據、解決數據中的衝突等。
數據轉換風險
數據轉換是數據治理過程中的一項複雜工程,如果方法不當,容易造成數據丟失。如果丟失的關鍵數據在15天內得不到恢復,企業就被淘汰出局。
數據轉換過程中,風險包括:
- 數據丟失 --> 做好數據備份
- 數據不完整 --> 做好前期校驗工作
- 數據不一致 --> 做好數據轉換
數據轉換有兩種基本類型
- 簡單變換
- 數據類型轉換
- 日期/時間格式轉換
- 代碼轉換
- 值域轉換
- 複雜變換
- 有效值清洗轉換
- 複雜的重新格式化
系統集成風險
- 對數據的應用做出嚴格的集成規定,形成一個較為集中的集成系統。
- 成立專門的核查小組對數據質量做出嚴格審核
- 集成過程中,不能簡單地把有質量問題的數據拋棄
還存在哪些風險呢?
-END-
閱讀更多 數據知道 的文章