如何規避主數據實施過程中的風險?未雨綢繆


數據治理05 | 如何規避主數據實施過程中的風險?未雨綢繆

《主數據驅動的數據治理》

王兆君、王鉞、曹超輝 編著

清華大學出版社,2019年4月版

全書四篇14章,358頁

第4章 主數據項目的準備

主數據實施過程中的主要風險包括組織管理風險、數據質量風險、數據轉換風險、系統集成風險等四個方面。

項目初期組織管理風險較為突出,項目建設過程中,其他風險較為突出。

組織管理風險

缺少組織風險的控制,將導致嚴重問題

  • 滯後,不能如期完工
  • 失控,成本上升
  • 焦慮,項目團隊凝聚力下降
  • 流失,項目管理團隊不穩定

首先,建立健全的項目管理組織,這是項目成功的基礎。

其次,需要公司高層領導的高度重視,推動跨部門協作,是項目成功的關鍵。


數據治理05 | 如何規避主數據實施過程中的風險?未雨綢繆


數據質量風險

數據質量主要體現在:

  • 是否準確,與假定正確值是否一致
  • 是否完整,必要屬性中是否有缺失
  • 是否一致,是否滿足已有的約束條件
  • 是否唯一,記錄(或碼值)是否有重複
  • 是否有效,是否滿足分類準則的要求

數據清洗是提高數據質量的最重要環節,主要包括確認輸入數據、修改錯誤值、保證數據值落入定義域、消除冗餘數據、解決數據中的衝突等。


數據治理05 | 如何規避主數據實施過程中的風險?未雨綢繆


數據轉換風險

數據轉換是數據治理過程中的一項複雜工程,如果方法不當,容易造成數據丟失。如果丟失的關鍵數據在15天內得不到恢復,企業就被淘汰出局。

數據轉換過程中,風險包括:

  • 數據丟失 --> 做好數據備份
  • 數據不完整 --> 做好前期校驗工作
  • 數據不一致 --> 做好數據轉換

數據轉換有兩種基本類型

  • 簡單變換
    • 數據類型轉換
    • 日期/時間格式轉換
    • 代碼轉換
    • 值域轉換
  • 複雜變換
    • 有效值清洗轉換
    • 複雜的重新格式化


數據治理05 | 如何規避主數據實施過程中的風險?未雨綢繆


系統集成風險

  • 對數據的應用做出嚴格的集成規定,形成一個較為集中的集成系統。
  • 成立專門的核查小組對數據質量做出嚴格審核
  • 集成過程中,不能簡單地把有質量問題的數據拋棄


數據治理05 | 如何規避主數據實施過程中的風險?未雨綢繆

還存在哪些風險呢?


-END-


分享到:


相關文章: