數據治理這件事其實沒有那麼難

作為一名大數據產品工程師,拜讀了很多關於數據管理方面的書籍,如大名鼎鼎的《DAMA數據管理知識體系指南》,再比如中國信息通信研究院和大數據技術標準推進委員會發布的《主數據管理實踐白皮書(1.0版)》,對於數據治理更有了一些深刻理解,今天就以億信華辰的一站式數據治理平臺——睿治為載體,淺談一下數據治理的框架以及如何進行。

產品往往是由需求決定的。2015年,國務院發佈《促進大數據發展行動綱要》,將發展大數據作為重要的戰略部署,賦予大數據作為建設數據強國、提升政府治理能力、推動經濟轉型升級的重要地位。經過這麼多年的建設,各大企業都積累了一大批數據,這些被企業用以支持業務流程運轉的數據,還起到了決策支持、風險控制、產品定價、績效考核等重要作用。但在實際工作中,也給企業帶來了不少煩惱、挑戰和各種問題,比如缺少統一標準、低質量數據造成決策失誤,以及大量的數據安全隱患等,這些在無形中給很多企業帶來了巨大的損失。在這樣的背景下,數據治理勢在必行,刻不容緩!

數據治理這件事其實沒有那麼難

那麼如何做好數據治理呢?

首先,元數據是數據治理的基礎。在大數據時代的背景下,數據即資產,元數據實現了信息的描述和分類的格式化,從而為機器處理創造了可能,它能幫助企業更好地對數據資產進行管理,理清數據之間的關係。元數據管理是企業提升數據質量的基礎,也是企業數據治理中的關鍵環節。但做好元數據管理可一點都不簡單,好的元數據產品必須得包含元模型管理、元數據採集、元數據檢索、元數據分析等功能。睿治元數據管理,它基本吻合了以上需求點,尤其它的的數據地圖功能,以一個更高的全局視角去展現元數據,快速形成對於系統元數據框架的理解,相當符合個人的一個學習習慣。

做好元數據之後,還得針對元數據建立統一的數據標準。數據標準也是數據治理中必不可少的一部分。睿治數據治理平臺提供了一套完整的數據標準管理流程及辦法,通過統一的數據標準制定和發佈等一系列的活動,結合制度約束、系統控制等手段,實現企業大數據平臺數據的完整性、有效性、一致性、規範性、開放性和共享性管理,為後續數據質量檢查、數據安全管理等提供標準依據。

等採集好元數據,搭建好數標體系,這時擋在面前的大山——數據質量管理就出來了。數據質量管理的確不容易:

1、質量規則得多,能夠覆蓋各種應用場景;

2、質量分析報告得直觀,用戶體驗好;

3、數據質量整改得簡單,流程化整改等等之類需求。

而睿治質量管理平臺,就是經過多個項目實踐應用的打磨,能夠充分滿足以上需求的一款軟件平臺。所謂梅花香自苦寒來,經過打磨才能得到美麗的珍珠不是嗎?

現在,經過數據標準的落地評估及數據質量管理,必然會發現各種有問題的數據,這時就需要對數據進行清洗、整合、轉換等操作了。睿治數據集成管理支持全拖拽式流程設計器、可視化的調試和預裝載、“零”表達式清洗組件等,既可以用於問題數據的修正,也可以用於為數據應用提供可靠的數據模型。

以上元數據管理、數據標準管理、數據質量管理、數據集成管理組成了數據治理的基礎功能,通過這些功能模塊得到的數據才能更好得進行管理和應用。但是得到數據不是關鍵,關鍵是這些數據價值的展現。

主數據建設在企業信息化戰略中處於核心地位,也是企業數據治理最重要的功能模塊之一了,所以主數據往往也被稱為“黃金”數據。主數據管理可以確保各個系統間”黃金”數據的一致性、完整性、可控性、正確性,從而提高數據質量,統一實體定義,簡化改進流程並提高業務的響應速度。

流動的數據才能產生更大的價值,數據交換必不可少。睿治平臺支持多系統、多類型的數據交換,更是滿足各種複雜環境下的部署,這些功能模塊中,我本人最愛的就是數據交換!

數據皆為資產,這裡還不得不提到數據資產管理,資產管理可以為用戶提供完整的資產視圖,管理者在平臺上可概覽企業資產,通過合理的方式管理內部數據和提供對外查詢,共享交換等服務,提升數據價值。

除了以上一些功能,還有如數據生命週期管理、數據安全這些功能模塊,針對數據治理的整體框架和流程,一圖以蔽之:


數據治理這件事其實沒有那麼難

寫在最後:

數據治理整體而言是個較為新興的互聯網產業,但是隨著大數據技術應用程度越來越深,其市場也愈來愈大,需求越來越多。大數據發展越快,數據治理越是必不可少!作為大數據產品攻城獅,只能更多的去了解市場,瞭解需求,做出更加符合市場發展的產品。共勉~


分享到:


相關文章: