大數據,或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。 在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據進行分析處理。大數據有5V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值密度)、Veracity(真實性)。
區塊鏈,是比特幣的底層技術架構,它在本質上是一種去中心化的分佈式賬本。區塊鏈技術作為一種持續增長的、按序整理成區塊的鏈式數據結構,通過網絡中多個節點共同參與數據的計算和記錄,並且互相驗證其信息的有效性。從這一點來說,區塊鏈技術也是一種特定的數據持久化技術。由於去中心化在安全、便捷方面的特性,很多業內人士看好其發展,認為它是對現有互聯網技術的升級與補充。
相對於區塊鏈,大數據“成名”更早,雖然二者是兩種截然不同的新興技術,但雙方之間存在較大的結合發展空間。大數據擁有海量數據存儲和分析技術,區塊鏈則提供了完整的賬本,二者若能相互協作,其價值會遠遠大於“一加一”。
一、數據安全
區塊鏈讓數據真正“放心”流動起來。區塊鏈以其可信任性、安全性和不可篡改性,讓更多數據被解放出來。用一個典型案例來說明區塊鏈是如何推進基因測序大數據產生的—區塊鏈測序可以利用私鑰限制訪問權限,從而規避法律對個人獲取基因數據的限制問題,並且利用分佈式計算資源,低成本完成測序服務。區塊鏈的安全性讓測序成為工業化的解決方案,實現了全球規模的測序,從而推進數據的海量增長。
二、數據流動性
許多人認為大數據就是對於現今的數據庫的一個數量級的提升,而現實情況也大抵如此,許多巨頭公司各自壟斷了用戶的部分數據,形成了一個又一個的巨型數據倉庫,也叫做“數據孤島”。
融入區塊鏈技術後,將打破這一局面。區塊鏈技術對數據的存儲是去中心化的,是共享的,除去了巨頭公司的壟斷壁壘,將每一個數據孤島連接在一起,這將大大提高數據的開放流動性,有助於大數據技術獲取更多更全面的數據進行分析。
三、數據存儲
區塊鏈技術通過網絡中所有節點共同參與計算,互相驗證其信息的真偽以達成全網共識,可以說是一種特定數據庫技術,而迄今為止大數據還處於非常基礎的階段。基於全網共識為基礎的可信的區塊鏈數據是不可篡改的、全歷史的,這就使數據的質量獲得前所未有的強信任背書,同時也使數據庫的發展進入了一個新時代。
閱讀更多 中搜網絡 的文章