數據時代下,中國能成為領跑者嗎?

前言

數據,正帶來無數的全新市場機遇。TEEC 天使基金投資項目之一,創新公司雲城數據科技有限公司提出了

“數據平臺”的概念, 或許它將決定,中國是否能領跑全新數據時代。

(本文轉自 網易 科技頻道,作者:硅星聞)

不久前,路透社的獨家新聞揭披露,惠普有意以100億美元的價格出售旗下軟件部門,逐步將發展中心向網絡、存儲及數據中心相關技術服務轉移。雖然惠普的軟件業務去年營收僅有36億美金,這個消息還是震動了整個IT界。

惠普並非第一間這樣做的大型高科技企業。今年六月,戴爾也賣出了旗下的軟件部門。在出售軟件部門之前,戴爾大手筆的收購了存儲行業的龍頭企業EMC,大舉進軍數據存儲及數據中心業務。

數據,正帶來無數的全新市場機遇,並隨之對業界乃至社會產生深重的影響。而中國作為數據中心市場發展最快的地區之一,是否能領跑全新數據時代,也成為了業界的焦點。

海量數據帶來全新市場

近年來,移動應用、物聯網技術、視頻VR技術不斷迭代。社會運行以及個人生活中的大量活動,都會引起數據的採集、分析、梳理、傳輸等行為。

新的數據,正以前所未有的速度產生。

“從人類文明的起始到2003年,我們一共創造了5EB(百億億字節)的數據。而如今,每兩天我們都在創造同樣數量的數據。到2020年,這個數字可能會變成53ZB(十萬億億字節),是現在的50倍。”Google的首席經濟學家Hal Varian預測道。

數據的增長帶來了數據存儲、處理、交換等業務的蓬勃發展,也引發了業內諸如亞馬遜、惠普、谷歌、戴爾等巨頭的新一輪戰爭。

同樣,數據的飛速增長也帶來了數據存儲市場的供求不平衡。業界普遍認為,未來3-5年數據存儲缺口將繼續擴大,帶來新一輪的市場機會。

Source: http://www.clivemaxfield.com/area51/do-not-delete/lar-0011n-eet-05-lg.jpg

數據平臺:非結構化數據帶來的全新數據模式

在存儲市場飛速增長的同時,這個市場以及其中涉及的技術也在悄然變化。

過去,絕大多數數據都以結構化數據的方式進行存儲。目前,非結構數據已經佔據數據存儲總量的90%。這些變化促成了數據的存儲、使用、分享的解決方案的一系列變化。

在未來幾年內,業界將要面臨的最大的挑戰,就是數據使用模式的改變。過去,很多數據是同業務系統綁定,許多業務系統的應用底下都有自己的數據庫。這些數據往往有獨特的格式,很難遷移或者被其他業務系統使用。

這也就帶來了我們所知道的數據的很多問題,比如“數據孤島”——在一個系統或者單位的內部,數據無法互通。另外,還有數據的重複存儲問題、數據的缺失、遺漏、以及不同步等等現象。這些問題不僅廣泛存在,更難以解決。

在創新公司雲城數據科技有限公司看來,未來以大數據為動力的技術及市場發展,很可能需要一種新的使用模式,那就是“數據平臺”

數據平臺,即以數據為中心的新的設計思路,擁有四個重要特徵

第一,它可以推動數據存儲的“虛擬化”。這意味對數據的訪問不再受到物理存儲的侷限,達到訪問自由。過去“數據孤島”問題,就此解決了。

第二,數據採集更加完整、統一,數據平臺的運行也將會更加平穩。在數據平臺裡,所有有權限的業務系統都能訪問數據,有效利用存儲空間。目前,數據往往屬於某一個業務系統。比如當用戶的家庭地址改變時,需要改好幾個業務系統裡的數據,如果漏掉了某一個系統,就會出現數據間的衝突。而完善的災備、工作流量管理(workload management)等等工具,也能保證平臺及服務的順利運行。

第三,數據平臺擁有標準的接口,可以更好地支持數據分析、挖掘、學習等等工具。

第四,明確數據的所有權和使用權,並有相應的管理手段,保證數據的歸屬權限和使用權限明確。歸屬權可以讓數據的所有者合法獲利。也就是說,想用歸屬者的數據需要付費。而使用權同等重要,可以讓使用原始數據分析、挖掘產生的商業見解而獲利。

這個“數據平臺”的未來,與谷歌、惠普等業界巨頭的數據存貯戰略是一致的。

在2016年的USENIX會議上,谷歌的數據中心基礎建設副總裁Eric Brewer呼籲業界共同設計面向未來的數據中心、雲服務所需的磁盤,以解決日趨嚴重的數據存儲問題。Brewer指出,隨著數據存儲結構的改變,未來的數據中心及雲服務的新理念將帶來同過往非常不同的新需求。對於磁盤,我們將不再要求單一磁盤的穩定性,而是要從混合管理的角度考慮存儲的成本、容量以及數據穩定性的最大化問題。

惠普企業存儲的高級副總裁Bill Hilf也指出,在企業越來越多地將雲計算應用到公司層面時,他們同時也在增加自己所能提供的應用。通過不同的雲服務(IaaS, PaaS, SaaS),他們能夠為這些應用或負載量來找到最適合的配送模型。最終我們可以想象到,企業的計算機部門就像是各類雲解決方案的前端,或“中介”。

而這些戰略也意味著一件事:大數據的核心,其實在於數據的流動。

“只有數據被業務系統鬆綁,可以動起來,可以快速有效的進入其他系統,梳理、分析、共享,大數據挖掘及機器學習才有了可能性。” 雲城數據科技有限公司的CEO王軼捷說道,“說到底,可流動的數據更有價值,而如何讓數據有效的安全的流動,是企業的痛點,也是我們試圖構建數據平臺的初衷。”

在可預見的未來,海量的數據以及對其的分析能力會大大提高社會的運行效率,但是也會帶來一系列的問題。而數據平臺這個概念以及它的種種特點,對於數據的安全性和可控性等問題,也有著積極作用。

清華信息科學與技術國家實驗室常務副主任李軍評論道:“開放與安全,既是一對矛盾,也是相輔相成的。只有通過數據平臺技術的不斷創新,保障數據在存取、流動和應用中所有權和使用權的明確歸屬、嚴格審計,全面落實私密、完整、可用等管控要求,才會有更多的個人和機構用戶擁抱數據的開放,共享數據的紅利。”

數據時代的中國速度

在過去的科技發展進程中,發達國家,尤其是硅谷,往往引領著新科技的誕生、乃至廣泛應用。然而在這場數據浪潮中,以中國為首的快速發展國家成為了新的亮點。

首先,從數據的增長速度來看,這些快速發展國家的的數據增長速度大大超越全球數據增長速度。業界預測,在2017年快速發展國家(中國、印度、俄羅斯、巴西、墨西哥)的數據總量將超過發達國家的數據總量。而中國無論從數據總量,數據增量,還是從上層應用的生態系統的活躍度,都引領快速發展國家甚至全球的發展。

深度 | 數據時代下,中國能成為領跑者嗎?

今年八月,ResearchandMarkets的一份報告指出,中國的數據中心市場將以每年13%的複合增長率持續增長,成為增長最快的市場之一。

“類似貴州等多個城市大數據的戰略定位,表明中國大數據的市場教育已經成熟,數據應用市場發展正在提速。而應用的深化必然對大數據的基礎設施提出新的需求,數據的平臺化勢在必行,也是一個極有潛力的投資方向。” TEEC天使基金創始合夥人夏淳說道。

深度 | 數據時代下,中國能成為領跑者嗎?

雖然在數據存儲行業,從磁盤、閃存、到系統集成商基本被歐美國家壟斷。但是如今的中國擁有著得天獨厚的優勢。如今的中國擁有世界最多的網民和世界最大的手機用戶群體,中國的互聯網行業孵化的一些新的商業模式,也走在了世界的前列。這些都給中國的大數據發展帶來了極大的動力。

同以往的技術迭代相比,大數據相關技術的迭代有其獨特的特性——從基礎架構到上層應用及業務系統,大數據的生態系統裡存在大量開源的系統及工具。這也就給中國大數據產業的迅速發展帶了了良好的環境。

從長遠的角度來看,以開源為基礎或以開源為參考,建立自主可控的大數據產業,是中國亟需的戰略投資。

“在當今時代,數據的戰略直接關係社會和國家的發展和安全。我們需要自主可控的解決方案,在支持發展的同時,也保證安全。從技術上來看,開源一方面促進了大數據的發展,一方面也給我們提供了一個非常好的機遇,可以有效的進行行業合作,甚至國家之間的合作。” 工信部CSIP前副總工及開源中心負責人、中國開源軟件推進聯盟專家委員會委員

劉明說:“未來是數據的年代,數據將無疑成為衡量一個國家的實力的最重要的指標之一。中國必須建立自主可控的數據解決方案,我們認為行業合作以及國家間的合作也會進一步推動技術的發展。”


分享到:


相關文章: