什麼是元數據以及元數據管理架構

元數據管理是企業數據治理的基礎。企業以元數據為抓手進行數據治理,幫助企業更好地對數據資產進行管理,理清數據之間的關係,實現精準高效的分析和決策。今天就帶大家深度解析下元數據管理。

認識元數據和元數據管理

元數據的定義是“關於數據的數據”,元數據與數據的關係就像數據與自然界的關係,數據反映了真實世界的交易、事件、對象和關係,而元數據則反映了數據的交易、事件、對象和關係等。簡單來說,只要能夠用來描述某個數據的,都可以認為是元數據。

什麼是元數據以及元數據管理架構

舉個例子:如果將圖書館裡面的某一本書當作數據,那麼所有用來形容這本書的數據比如書名、書的作者、書的所屬類別等都是這本書的元數據。

對於企業而言,元數據是跟企業所使用的物理數據、業務流程、數據結構等有關的信息,描述了數據(如數據庫、數據模型)、概念(如業務流程、應用系統、技術架構)以及它們之間的關係。

元數據管理是對數據採集、存儲、加工和展現等數據全生命週期的描述信息,幫助用戶理解數據關係和相關屬性。元數據管理工具可以瞭解數據資產分佈及產生過程。實現元數據的模型定義並存儲,在功能層包裝成各類元數據功能,最終對外提供應用及展現;提供元數據分類和建模、血緣關係和影響分析,方便數據的跟蹤和回溯。

元數據管理平臺架構

元數據管理統一管控分佈在企業各個角落的數據資源,企業涉及的業務元數據、技術元數據、管理元數據都是其管理的範疇,按照科學、有效的機制對元數據進行管理,並面向開發人員、最終用戶提供元數據服務,以滿足用戶的業務需求,對企業業務系統和數據分析平臺的開發、維護過程提供支持。

作為企業數據治理的基礎,元數據管理平臺從功能上主要包括:元數據採集服務,應用開發支持服務,元數據訪問服務、元數據管理服務和元數據分析服務。

1、元數據採集服務:能夠適應異構環境,支持從傳統關係型數據庫和大數據平臺中採集從數據產生系統到數據加工處理系統到數據應用報表系統的全量元數據,包括過程中的數據實體(系統、庫、表、字段的描述)以及數據實體加工處理過程中的邏輯;

什麼是元數據以及元數據管理架構

億信華辰元數據管理平臺內置多種採集適配器,支持多種存儲格式的元數據自動獲取,如:數據庫、報表工具、ETL工具、文件系統等,同時無法完成自動獲取的元數據,提供了可自定義的元數據採集模版完成元數據的批量導入。

2、元數據訪問服務:元數據訪問服務是元數據管理軟件提供的元數據訪問的接口服務,一般支持REST或Webservice等接口協議。通過元數據訪問服務支持企業元數據的共享,是企業數據治理的基礎。

3、元數據管理服務:實現元數據的模型定義並存儲,在功能層包裝成各類元數據功能,最終對外提供應用及展現;提供元數據分類和建模、血緣關係和影響分析,方便數據的跟蹤和回溯。

什麼是元數據以及元數據管理架構

億信華辰元數據管理平臺提供各類元數據管理,包括:業務元數據、技術元數據和管理元數據,支持元數據的基本信息、屬性、依賴關係、組合關係的增刪改查操作。最新元數據和定版元數據隔離,在最新元數據中的改動不影響定版元數據的正常使用,同時每次發佈都有版本留痕,支持各版本的對比分析。

4、元數據分析服務:元數據的應用一般包括數據地圖,數據的血緣、影響分析,全鏈分析等;

什麼是元數據以及元數據管理架構

億信華辰元數據管理平臺提供了豐富的元數據分析功能,包括血緣分析、影響分析、全鏈分析、關聯度分析、屬性值差異分析等,分析出元數據的來龍去脈,快速識別元數據的價值,掌握元數據變更可能造成的影響,以便更有效的評估變化帶來的風險,從而幫助用戶高效準確的對數據資產進行清理、維護與使用。

血緣分析:告訴你數據來自哪裡,都經過了哪些加工。

影響分析:告訴你數據都去了哪裡,經過了哪些加工。

冷熱度分析:告訴你哪些數據是企業常用數據,哪些數據屬於僵死數據。

關聯度分析:告訴你數據和其他數據的關係以及它們的關係是怎樣建立的。

數據資產地圖:告訴你有哪些數據,在哪裡可以找到這些數據,能用這些數據幹什麼。

元數據管理價值

元數據管理到底有什麼用?圖書館的目錄卡片只是一個很簡單的元數據管理,在企業中,元數據管理會更為全面,難度更高,同時也將帶來更多的收益:

元數據管理平臺為用戶提供高質量、準確、易於管理的數據,它貫穿數據中心構建、運行和維護的整個生命週期。同時,在數據中心構建的整個過程中,數據源分析、ETL過程、數據庫結構、數據模型、業務應用主題的組織和前端展示等環節,均需要通過相應的元數據的進行支撐。

通過元數據管理,形成整個系統信息數據資的準確視圖,通過元數據的統一視圖,縮短數據清理週期、提高數據質量以便能系統性地管理數據中心項目中來自各業務系統的海量數據,梳理業務元數據之間的關係,建立信息數據標準完善對這些數據的解釋、定義,形成企業範圍內一致、統一的數據定義,並可以對這些數據來源、運作情況、變遷等進行跟蹤分析。

總結:元數據是企業數據資源的應用字典和操作指南,元數據管理有利於統一數據口徑、標明數據方位、分析數據關係、管理數據變更,為企業級的數據治理提供支持,是企業實現數據自服務、推動企業數據化運營的可行路線。當然這一切離不開元數據管理工具的推動。


分享到:


相關文章: