劉興亮|大數據與區塊鏈的碰撞

劉興亮|大數據與區塊鏈的碰撞

大數據與區塊鏈是當今最熱門的兩個話題,帶動了一系列的投資熱潮。不論是風投領域,還是傳統的金融領域,只要有這兩個關鍵詞出現,往往能讓企業獲得特別的關注。這也說明了這兩個詞在當今社會的火爆程度。

我們在前文中已經從各個維度對區塊鏈進行了詳細闡述,那麼大數據又是什麼呢?現在很多人都認為,大數據的本質是「大」。也就是說,它的數據量必須非常的廣泛和巨大,可能是海量級的。其實這並不準確。

大數據所指的「大」其實更偏向於全,也就是儘可能地接近某個統計範疇內最全面的數據,甚至達到全數據的統計結果。只有這樣才能真正實現大數據的基本目標。

大數據引起人們的關注,事實上是因為可以通過它對未來做出預測,獲取詳細分析,對未來進行有針對性的指導。想要實現這些,最重要的就是數據的提取和分析。

事實上,大數據目前最成功的領域是在歷史學。這可能是一個平時不太引人注目的範疇。但事實上,正是因為在歷史數據的分析方面發揮了巨大作用,人們才會對大數據有了更大的興趣。

最早進行這種分析的是一位英國的歷史學家。他把所有歷史數據進行了一次編碼——當然這裡的歷史數據指的是關於重大事件與經濟、政治等方面的數據。之後,他把這些編碼以一個自有的邏輯對其進行了分析。

劉興亮|大數據與區塊鏈的碰撞

例如,在一個重大的政治事件發生之前多少年,會發生一次旱災,或者一次重大疾病的流行對宗教的傳播有什麼影響。以這樣的模式,這位歷史學家對過去幾千年的人類歷史進行了一次梳理和分析。結果他發現了一個預測模式,通過這個模式,他甚至可以預測未來的某一年,在世界上的某個國家會發生什麼樣的重大歷史事件,而這種預測的準確率達到了一個很高的水平。

雖然這些所謂的預測最終可以被改變,因為人們已經掌握了規律,可能採取一些措施,但是這樣的嘗試給了人們一種可能:也就是通過對過去的歷史數據進行分析,可以得到對未來發展變化的預測。這當然也符合我們現在所有的預測模式。比如在灰色預測過程中,事實上就是通過將過去的數據放入方程,去預測未來的發展模式,而這一切都與數據相關。

因此我們可以認為,假如有足夠多的數據量,就可能對世界上所有即將發生的事情進行預測。如果能夠做到這一點,那麼無疑我們將控制整個世界的變遷。

這要怎麼做到呢?要實現這一點需要不斷提取儘可能多的數據。

但是,現實和理想總是有區別的。在整個大數據分析過程中,有一種觀點是:世界上只有 5% 的數據是結構化數據,也就是人們常規認為的數字信息;剩下 95% 的數據都是不可量化的。這意味著,不可能有絕對正確、絕對全面的數據。

通過區塊鏈模式,可以儘可能地將那些非結構化的數據進行結構化處理。通過將現有各種數據拆解並存儲於各個存儲單元,我們能對整個世界的數據模式有更加清晰的認知。

既然說到區塊鏈,那麼要解決的一個問題必然是信息的安全性問題。區塊鏈在這方面所能起到的作用是不可替代的。通過將區塊鏈應用到各種數據的提取過程中,就可以實現我們對各種研究所需的非結構化數據的集中使用,而不用擔心這些數據被肆意傳播和濫用。這也就預防了可能出現的數據風險。

從更深遠的意義來說,我們對數字的應用模式從根本上發生了變化。也就是說,我們過往的研究所需要使用的數據,往往都是某個機構積累的,或者某些企業出錢購買的數據。但是當我們通過區塊鏈模式鏈接各種各樣的數據之後,就會發現數據之間的壁壘被打通了,研究也會變得更加順暢,大數據分析也就變得更加有效。

當然,區塊鏈也可能帶來另外的問題。

在大數據研究中,有的時候我們需要對某一群體的特徵進行精確的分析和描繪。但是大數據要求的這種數據模式,在區塊鏈中卻很難實現。比如說,我們要確認一組人群——80後或者90後——他們在職場中真正面臨的困境是些什麼。通過對這個問題的進一步細緻和深化,我們就可以把分佈式存儲在各個領域裡的、關於各種各樣情境的困惑集中起來,形成我們的結論。

但如果再進一步,想了解某一家企業、一個群體或者某一個具體區域的人群的特點,我們就無法得到有效的數據標籤來實現分析了。

換句話說,區塊鏈通過犧牲數據的個性化標籤來實現我們對某一類問題進行系統研究的可能性,但是同時也讓我們在進一步的分析過程中,遭遇數據提取的困難。

總體來說,區塊鏈還是為大數據研究提供了一種非常有效的支撐。它可以幫助我們更好地實現大數據的應用,也解決了各種數據之間橫向遷移時的壁壘。

劉興亮|大數據與區塊鏈的碰撞

而另一方面,大數據也為區塊鏈的應用提供了更好的支撐。

從目前的情況來看,區塊鏈的應用範圍依然比較狹窄。雖然它在很多領域中都有非常好的前景和解決具體問題的能力,但是具體到某個領域的時候,區塊鏈卻總是很難實現目標。

在這種情況下,如何能夠取得突破,快速找到一個能夠讓區塊鏈落地並且被大家使用的方式,就非常重要了。

與之相反,大數據的應用事實上已經被很多人所接受。尤其在商業領域,通過大數據分析實現商業競爭的目標,也成為很多企業的首選做法。在這種環境下,如果區塊鏈能夠給大數據的研究提供更好的支撐,可能就會帶來對區塊鏈應用需求的上升,這事實上可以為區塊鏈的應用和推廣帶來非常好的推動作用。

劉興亮|大數據與區塊鏈的碰撞

區塊鏈與大數據的整合,在未來將是一個必然的趨勢,大數據的研究將越來越深入地觸及人類社會的底線。我們的隱私、數據權利和思想權,都將成為討論的範疇。

而區塊鏈則可以讓大數據的研究跨越這些壁壘,形成無標籤化的數據結構,讓大數據研究者僅從數據看數據,而不考慮倫理的種種限制,這事實上也為未來的技術研發帶來更廣闊的可能性。同樣,藉助大數據的東風,區塊鏈也有可能很快找到自己在現實中的落腳點,獲得更好的發展。


▴註釋:


分享到:


相關文章: