02.26 歪解大數據3V特徵

在這個跟風的時代,大數據風已經不再強勁。但這篇文章對我來講,還有個功能做為公司的內訓的一部分,因此做為最經典的大數據的3V特徵還是要說一下。在各種大會演講中 3V特徵(Volume、Velocity、Variety)大概是這樣的。

(1)Volume容量巨大。基本上的故事是未來數據將不是以MB和GB計算,未來的數據至少是TB, PB和 ZB的。

(2)Variety(數據多樣性)。基本上講的是,數據有結構化數據、半結構化數據和非結構化數據,在小數據時代基本以結構化數據為主。講講圖片和視頻的故事,所以聽眾產生了個典型誤解,半結構化、非結構化處理能力才是大數據能力。

(3)Velocity(速度快)。由於數據自身具有時效性,其所能挖掘的價值可能稍縱即逝,如果大量的數據來不及處理,其價值也會衰減。所以,現在的競爭不僅僅是數據的競爭,同時還是速度的競爭。

歪解大數據3V特徵

什麼是Big?


我們的角色呢? 做為數據專業工作者,就是給這些形式化的解釋加加料,各位專家、教授講的是對的,只是太形式化了,有點離本質太遠。某些方面使聽眾沒法真正理解什麼是大數據?專業的數據工作者的加了人間煙火的解釋是:

第一個是Volume(海量), Volume本質其實不是TB、也不是PB和ZB,Volume是個相對的概念,不用那麼大,那麼多,只是相對比原來多就行。所以我們的用戶不用再擔心,我們沒有TB級別的數據就不是大數據了。舉個例子:假如我是一家服裝經銷商,我2000條數據,我就可以自己的銷售情況,瞭解紅色的賣的好,還是毛毛蟲賣的好。我有20000條數據可以瞭解整個市場(比如:五愛市場),我有200000萬條數據可以瞭解整個城市的銷售趨勢。以決定我來年的訂貨決策。因此Volume真正概念是儘量獲取更多的數據,不一定是TB,還是PB. 以輔助我們的決策、或者對社會、事務的認知。

第二個是Velocity(速度),各種武功,唯快不敗,尤其在現在的商業環境下,已經快到可以不尊重自然規律,單純的追求快的程度。在數據領域給大家加個料,叫現代倒爺,在黃金市場,有上海交易所,倫敦交易所和芝加哥交易所等等,在某個時間點,我們可以在上海買入145.1元,在倫敦賣出以賺取價差,145.11元,只有你的速度足夠快,比如1微妙之內。這個80年代倒電子錶,服裝的倒爺是不是類似。廣州的價格和北京價格不一樣就行,而且數字的時間物流比較簡單,以近光速的形式傳輸的數據。

第三個是Variety(多樣性),什麼是多樣性呢?其實不僅僅是結構化數據+非結構化數據這麼問題。數據來源多樣,形式多樣都可以算是多樣性。比如:醫生為病人看病,有了體溫數據,再加一些血液的化驗數據,更容易判斷你是感冒了,還是得了肺炎。同樣,如果海關的報關數據、再加上市場上實際銷售價格數據,對稅收管理和風險管理可能都有所幫助。

數據是個有意思的東西,有了數據可以帶來直接或者間接的收益是非常可觀的,可以幫你寫論文,可以幫企業賺錢。大數據的核心其實不是“大”。大數據是用數據解決問題的思維、處理問題的方式。“大”這個字很好,雖然不精確,但有利於傳播。


分享到:


相關文章: