書籍丨大數據時代:生活、工作與思維的大變革

大數據,人工智能,區塊鏈,這些陌生但又不陌生的詞近2年來可以說不斷的在財經與科技版塊刷屏。如果你是一位想要提前規劃自己未來的人,提前瞭解這些知識,並且做好規劃。至少可以跑贏你的同年人3到5年。本週分享書籍來自舍恩伯格的《大數據時代:生活、工作與思維的大變革》,這本書屬於瞭解大數據入門級別的經典書籍之一。

書籍丨大數據時代:生活、工作與思維的大變革

什麼是大數據?

舍恩伯格教授在他的書《大數據時代》中是這樣描述的:“大數據是指不用隨機分析法這樣的捷徑,而採用所有數據的方法。”也就是說,所謂的大數據是一個比較的概念。它是在人類過去運用小數據庫隨機抽樣獲得分析結果比較而來。它的關鍵是在“大”,數據容量越多越好。大數據的核心作用在於“預測”,也是人們常說的預判未來。

在數據還沒如此龐大以及可獲得性如此便利的過去,人類需要分析某些問題獲取結論往往是靠隨機抽樣的方法,例如在某一個特定地人群中抽取多少人進行抽樣調查。假設我想了解80後婚姻狀況的分析,我從上海地區80後中選取5000個人進行調查。這種分析方法就是過去統計學家與社會學家常用的隨機抽樣,也稱為定性分析法。

書籍丨大數據時代:生活、工作與思維的大變革

大數據有哪些特徵?

1. 允許不精確

在越來越多的情況下,使用所有可獲取的數據變得更為可能,但為此也要付出一定的代價。數據量的大幅度增加會造成結果的不準確,於此同時,一些錯誤的數據也會混進數據庫。大數據不及讓我們不再期待精確性,也讓我們無法實現精確性。

錯誤並不是大數據固有的特性,而是一個急需我們去處理的現實問題,並且有可能長期存在。因為擁有更大數據量所能帶來的商業利益遠遠超過增加一點精確性,所以通常我們不會再花大力氣去提升數據的精確性。

2. 相關關係

在過去小樣本的數據世界中,相關關係也是有部分作用。但在大數據的背景下,相關關係大放異彩。通過應用相關關係,我們可以比以前更容易、更快捷、更清楚地分析事物。建立在相關關係分析法基礎上的預測是大數據的核心。且這種分析方法更準確、更快,而且不易受偏見的影響。比如,我們在淘寶上購物時,當登陸ID賬號後,每一個人的瀏覽主頁面是完全不相同,因為淘寶本身有一套數據算法,它是根據你的瀏覽記錄推薦的物品是完全符合你個人的偏好,而算法的模型是建立在相關性上的。

相關關係的核心是量化兩個數據值之間的數理關係。相關關係強是指當一個數據值增加時,另一個數據值很有可能隨之增加。相反,相關關係弱就意味著當一個數據值增加時,另一個數據值幾乎不會發生變化。

3. 數據化

數據化是指一種把現象轉變為可製表分析的量化形式的過程。它的核心動力來源於人類測量、記錄和分析世界的渴望。數據化的實現有一點必不可少,那就是要從潛在的數據中挖掘出巨大的價值,然後揭示出新的深刻洞見。

數字化是指把模擬數據轉換成為用0和1表示的二進制碼,這樣電腦就可以處理這些數據了。

數字化帶來了數據化,但是數字化無法取代數據化。數字化是把模擬數據變成計算機可讀的數據,和數據化有本質上的不同。

書籍丨大數據時代:生活、工作與思維的大變革

大數據有哪些價值鏈?

根據所提供價值的不同來源,分別出現了三種大數據公司。這三種來源是指:數據本身、技能與思維。

第一種是基於數據本身的公司。這些公司擁有大量數據或者至少可以收集到大量數據,卻不一定有從數據中提取價值或者用數據催生創新思想的技能。比如,國內的新浪微博,用戶數量至少過億,但是它一部分的商業核心價值是作為流量池為阿里旗下的淘寶導流。

第二種是基於技能的公司。它們通常是諮詢公司、技術供應商或者分析公司。它們掌握了專業技能但並不一定擁有數據或提出數據創新性用途的才能。比如說國內的大數據公司像極光、talkdata等提供分析數據。

第三種是基於思維的公司。對於某些公司來說,數據和技能並不是成功的關鍵。讓這些公司脫穎而出的是其創始人和員工的創新思維,他們有怎樣挖掘數據的新價值的獨特想法

到目前為止,前兩種因素一直備受關注,因為在現今世界,技能依然欠缺,而數據則非常多。近年來,一種新的職業出現了,那就是“數據科學家”。數據科學家是統計學家、軟件程序員、圖形設計師與作家的結合體。與通過顯微鏡發現事物不同,數據科學家通過探尋數據庫來得到新的發現。

書籍丨大數據時代:生活、工作與思維的大變革

誰才是大數據價值鏈中最大獲益者?

目前看來,應該是那些擁有大數據思維或者說創新性思維的人。就像我們所看見的一樣,自從信息時代以來,第一個吃螃蟹的人都發了大財。但是,這種先決優勢並不能維持很長的時間。隨著大數據時代的推進,別人也會吸收這種思維,然後那些先驅者們的優勢就會逐漸減弱。

那麼,核心價值會不會在技術上?筆記,一個金礦的價值也只有在它被挖掘出來後才有意義。但是,計算機的歷史卻否認了這個想法。現在,在數據庫管理、數據科學、數據分析、機器學習算法等類似行業的技能確實很走俏。但是,隨著大數據成為人們生活的一部分,而大數據工具變得更容易和更方便使用,越來越多的人會掌握這些技能,所以這些技能的價值就會相對減少。當然,這並不是說大數據技能不重要,只是這不適合大數據價值的最主要來源。畢竟,技術時外在的力量。

最終,大數據的大部分價值還是必須從數據本身中挖掘。因為在未來,我們可以利用數據做更多的事情,而數據擁有者們也會真正意識到他們所擁有的財富。因此,他們可能會把他們手中所擁有的數據抓得更緊,也會以更高的價格將其出售。因為只有金子才是真正值錢得。


分享到:


相關文章: