原始數據、數據清洗、數據集市、數據處理、數據可視化的通俗理解

“大數據分析”這麼高大上,怎麼講才能最通俗呢,做飯和大數據有什麼關係呢?請聽下面分析:

原始數據、數據清洗、數據集市、數據處理、數據可視化的通俗理解

第一階段:

菜地裡的毛菜(原始系統的數據,有錯誤,不精準,毛菜有泥巴,有黃葉子),相當於ERP,PDM系統裡面的原始數據。

原始數據、數據清洗、數據集市、數據處理、數據可視化的通俗理解

第二階段:

從菜地裡採集到家,分門別類的堆在一起(初步去掉泥巴,黃葉子,分類堆放),相當於從原系統到ODS,ODS的意思是操作數據,即原始系統中的操作數據的一個副本,與原始數據是一模一樣的,叫貼源,這個過程就叫數據採集、清洗、轉換,即ETL乾的事情,這個階段叫初加工。

原始數據、數據清洗、數據集市、數據處理、數據可視化的通俗理解

第三階段:

把拿回家的各種菜洗淨,去皮,按大小分類,去掉小的、爛的蔬菜,可以賣給超市了,對BI項目來說,就是從ODS到數據倉庫的過程,數據的精加工過程,去偽存真,也要用到ETL來清洗轉換,對缺項的數據補充完整,比如合併數據,合併字段,增加主數據描述字段,補充分類等。

第四階段:

從菜農賣到超市,超市還要經過一次加工,比如包裝成一小包一小包的,把蔬菜放在一起,水果放在一起,便於顧客直接購買,這一步就是從數據倉庫到數據集市的過程,數據集市就是包好、稱好的淨菜,價籤已經打好的了,顧客直接付款可以拿走了,從數據倉庫到數據集市就是形成一個一個的數據立方體,這個立方體的數據是加工好的,可以單獨發佈出去,離線使用,相當於一個execl數據文件,你可以用EXECL工具打開,也可以用WPS打開,打開以後,可以用表格表示,也可以用圖表表示。

原始數據、數據清洗、數據集市、數據處理、數據可視化的通俗理解

第五階段:

媽媽配菜,媽媽根據家人一天要吃的菜餚規劃,挑選各種各樣的菜、肉組合在一起,有的直接可以食用,有的需要再加工,即烹調,然後端出來擺到餐桌上,家人只需要帶一張嘴即可享用,對BI項目來說,就是報表的製作過程,業務分析人員,根據領導的要求,按照各個主題需求,從各個數據立方體中、或者一部分從數據倉庫中取一些數據組合起來,並且定義展現方式,即把報表做好,發佈出來,放到門戶上,給與權限控制,哪些人可以享用這桌美味,這就是報表製作這個階段乾的事情,所以說,業務人員是否可以拖拽製作報表,關鍵看前面的數據立方體準備好沒有,相當於是這樣的,不是人人都是烹調高手,但是超市裡面有很多配好的菜(蔥薑蒜都有了),你只要拿回去放放鍋裡炒5分鐘或者蒸煮10分鐘,端出來即可,不難吧。至於加工的工具是微軟家的鍋還是IBM家的灶,或者oracle家的瓢,有什麼關係呢,這些都是報表製作工具(烹調工具而已)。

原始數據、數據清洗、數據集市、數據處理、數據可視化的通俗理解

第六階段:

享受美味佳餚,把做好的一桌筵席,放到門戶上,當然是給有權限的人享受,這就是管理駕駛艙噻。

原始數據、數據清洗、數據集市、數據處理、數據可視化的通俗理解

原始數據、數據清洗、數據集市、數據處理、數據可視化的通俗理解


分享到:


相關文章: