《主數據驅動的數據治理》
王兆君、王鉞、曹超輝 編著
清華大學出版社,2019年4月版
全書四篇14章,358頁
第4章 主數據項目的準備
主數據實施過程中的主要風險包括組織管理風險、數據質量風險、數據轉換風險、系統集成風險等四個方面。
項目初期組織管理風險較為突出,項目建設過程中,其他風險較為突出。
組織管理風險
缺少組織風險的控制,將導致嚴重問題
滯後,不能如期完工失控,成本上升焦慮,項目團隊凝聚力下降流失,項目管理團隊不穩定首先,建立健全的項目管理組織,這是項目成功的基礎。
其次,需要公司高層領導的高度重視,推動跨部門協作,是項目成功的關鍵。
數據質量風險
數據質量主要體現在:
是否準確,與假定正確值是否一致是否完整,必要屬性中是否有缺失是否一致,是否滿足已有的約束條件是否唯一,記錄(或碼值)是否有重複是否有效,是否滿足分類準則的要求數據清洗是提高數據質量的最重要環節,主要包括確認輸入數據、修改錯誤值、保證數據值落入定義域、消除冗餘數據、解決數據中的衝突等。
數據轉換風險
數據轉換是數據治理過程中的一項複雜工程,如果方法不當,容易造成數據丟失。如果丟失的關鍵數據在15天內得不到恢復,企業就被淘汰出局。
數據轉換過程中,風險包括:
數據丟失 --> 做好數據備份數據不完整 --> 做好前期校驗工作數據不一致 --> 做好數據轉換數據轉換有兩種基本類型
簡單變換數據類型轉換日期/時間格式轉換代碼轉換值域轉換複雜變換有效值清洗轉換複雜的重新格式化系統集成風險
對數據的應用做出嚴格的集成規定,形成一個較為集中的集成系統。成立專門的核查小組對數據質量做出嚴格審核集成過程中,不能簡單地把有質量問題的數據拋棄還存在哪些風險呢?
-END-