企業要如何充分發揮大數據所賦予的機遇與優勢?

在數據倉庫時代,數據質量是生命線;在大數據時代,數據能夠及時準確地處理,仍然至關重要。

企業要想充分發揮大數據所賦予的機遇和優勢,前提是必須擁有可靠、準確、及時的高質量數據,只有從高質量的大規模數據中提取隱含的、有用的信息,企業才能做出更加精準、更加符合市場和客戶需求的決策;否則,大數據的優勢將化為泡影。為此,企業需要更加註重大數據時代下的數據質量。數據質量是大數據產生跨區域、跨行業、跨部門價值的保障。

企業要如何充分發揮大數據所賦予的機遇與優勢?

然而,在大數據時代下,企業要想保證大數據的高質量卻並非易事,很小的、容易被忽視的數據質量問題在大數據環境下會被不斷放大,甚至引發不可恢復的數據質量災難。因此,如何保證大數據的數據質量,以及如何有效地挖掘隱藏在大數據中的信息,成為企業日益關心的問題。數據質量如何把控?首先要關注如下數據質量六大基本要素是否滿足。

企業要如何充分發揮大數據所賦予的機遇與優勢?

(1)完整性:主要包括實體不缺失、屬性不缺失、記錄不缺失和字段值不缺失四個方面。

(2)唯一性:指主鍵唯一和候選鍵唯一兩個方面。

(3)一致性:指統一數據來源、統一存儲和統一數據口徑。

企業要如何充分發揮大數據所賦予的機遇與優勢?

(4)精確度:指計量誤差、度量單位等方面的精確程度。

(5)合法性:主要包括格式、類型、域值和業務規則的有效性。

(6)及時性:指數據刷新、修改和提取等操作的及時性和快速性。

在大數據平臺中,由於數據量的巨大以及數據結構的複雜使得上述六大要素很難同時滿足,不滿足不見得就一定發生了嚴重的數據質量問題,但是當六大要素的環比情況發生異動時,往往就意味著上游系統的異常。

企業要如何充分發揮大數據所賦予的機遇與優勢?

同時,提及數據質量,我們一般也會談到元數據。一般認為,元數據泛指描述大數據系統中的概念、關係和規則的數據。簡單來說,元數據就是指描述數據的數據,專門為數據管理功能提供相關的信息支撐。


分享到:


相關文章: