城市數據湖—— 為“新基建”築基,為“數據要素市場”加料

中國網福建訊 隨著互聯網的高速發展,“萬物數據化”浪潮奔騰而來。4月9日,中央重磅發文《中共中央、國務院關於構建更加完善的要素市場化配置體制機制的意見》(下稱《意見》),數據首次被納入生產要素範圍。數據資源已經成為關鍵的生產要素,而海量數據的處理與分析要求構建大數據中心。這必然要求作為“底座”的數據中心不斷擴大規模,不斷優化,升級數據基礎設施才能更好地支撐整個中國數字經濟的升級和持續發展。

近期,中央也密集點名“新基建”,新基建正成為朝野共識、地方紛紛發力、市場積極響應的戰略性新舉措。新基建的核心是數字基建,在5G、人工智能、區塊鏈等新技術業務驅動下,市場呼喚更先進的“新基建”數據中心,呼喚綠色、安全、海量的數據存儲基礎設施。面對時代的需求和國家政策的要求,城市數據湖作為DT時代數字經濟基礎設施應運而生,為政府在大數據時代實現海量數據存儲和計算提供了可能。城市數據湖是區別於傳統數據中心的一種新型的數據中心模式,是支撐數據採集、傳輸、存儲、計算、分析、應用、安全等能力的新一代數字經濟基礎設施,

新基建的賽道已開啟,城市數據湖正在成為“新基建”的“弄潮兒”。

城市數據湖,順應大數據時代發展的產物

目前,巨量數據存儲的高成本、數據安全度低、數字資源開發利用程度不足等問題都制約了數字經濟發展。磁存儲在能耗和壽命等方面的缺陷,使其在面對海量數據長期存儲時顯得乏力。數據湖依託藍光存儲低能耗、高壽命、高密度(普通磁存儲設備壽命只有3-5年,藍光存儲能實現至少50年無需更換存儲介質)等優點,為大數據長期存儲提供了根本保障,同時為數據量幾何倍增長的情況提供了集約化實現能力,避免了設備和空間的浪費,具有“海量、綠色、安全、生態”四大特色。數據湖建設勢必成為新時代數據存儲發展的新方向。

數據湖是面向政府、企業、個人,融合數據感知、存儲、分析為一體,以高效降低存儲能耗和成本的光電磁全介質混合存儲系統為基礎;以滿足數據存儲讀寫速度、存儲時間、存儲安全、分佈式存儲等全需求場景為目標;以收集、整理、開放數字經濟核心要素“數據”,發展區域數字經濟為己任;以實現數據資產受託保管、受託治理、受託交易的數據銀行為核心商業模式;以人工智能、雲計算、雲存儲為主要服務形式,實現“超級存儲”、“超級連接”、“超級計算”相配套的新一代城市數字經濟基礎設施。

城市數據湖—— 為“新基建”築基,為“數據要素市場”加料

圖1:數據湖四大特色:海量 綠色 安全 生態

城市數據湖作為新基建,“新”在哪兒?

黨的十九屆四中全會《決定》指出,“健全勞動、資本、土地、知識、技術、管理、數據等生產要素由市場評價貢獻、按貢獻決定報酬的機制”,數據作為生產要素參與收益分配,將推動大數據更大規模更深層次的應用,同時對“新基建”數據中心的發展提出更高要求。城市數據湖區別於傳統的IDC,作為新基建的“新”主要體現在以下幾個方面:

新範式:海量、綠色、安全、全介質、全場景、智能、智慧。以藍光為主介質的光磁電混合全介質、全場景存儲綠色節能、安全可靠、擁有海量數據,並將智能、智慧融為一體,城市數據湖不僅僅是升級版的IDC,更是新型數智化數據中心,又能引導新興產業,也是新型信息消費的市場,同時也與其他領域新基建相互支撐,是數字產業化、產業數字化的新引擎。

新技術:新基建發展驅動存儲技術革新。大數據時代,為了在浩如煙海的數據中捕捉到有價值、可利用的信息,需要一個能夠容納無窮多數據信息的巨大信息庫,以便在滿足龐大存儲需求的同時,精準而快速地對數據進行捕獲、分析、加工和處理。光磁一體存儲技術為實現海量數據的低成本存儲提供了可能,使其最大程度發揮價值。基於500G以上超大容量藍光光盤技術的光磁電混合存儲架構,融合人工智能算法實現高低頻冷熱數據的EB級長效存儲和高效計算支撐。數據湖人工智能引擎,提供AI中臺及人工智能多場景算法平臺,開發AI基礎算法層,為跨行業、跨組織、跨領域、跨鏈融合業務提供算法支撐。

新體系:數據共建共享共用新路徑。數據湖致力於構建以數據為中心的體系模式,通過數據流的引領,打破城市信息資源的壁壘,打通經濟社會發展的信息“大動脈”,成為信息時代數據開放共享的新載體。同時,為各級政府進行數據資源共享提供合作平臺和技術媒介,實現跨層級、跨部門、跨系統的數據資源查詢和利用。

新應用:“數據湖+行業大數據應用”,實現數據增值。圍繞政府、企業、個人對數據價值的N次碰撞分析挖掘和深度應用需求,面向大交通、大安全、醫療、教育等跨行業應用場景,提供鮮活的生態級解決方案,使沉澱的數據在行業應用場景中大放異彩。

新生態:產業生態構建的強載體。依據“一個數據湖就是一個產業集群”的理念,圍繞數據湖基礎設施構建產業生態,不斷延伸上中下游產業鏈條,實現以數據驅動產業發展的新模式,以數據流引導技術流、業務流、資金流、人才流等。聚合並帶動一個多層級、多產業的生態體系,助力城市加速孵化新興產業,推進“數字經濟”與“產業經濟”深度融合。

城市數據湖能為“數據要素市場”加什麼“料”?

數據要素市場化配置上升為國家政策。《意見》提出,要推進政府數據開放共享,提升社會數據價值資源,加強數據資源整合和安全保護並強調引導培育大數據交易市場,為數據要素市場配置指明瞭方向。城市數據湖有望在數據要素市場配置發展進程中,擔任不同角色,發揮不同的作用。

一是數據存儲及備份,城市數據湖沉澱海量數據,將成為“數據要素市場”最大的數據原材料供應商。數據湖匯聚了政府、企業、個人大量的數據,存儲了大量包括結構化、非結構化的數據,支持所有的數據類型,提供社會大數據一級開發和存儲服務,以及同城災備、異地容災等,可以說將成為這個數據要素市場最大的數據存儲服務和數據提供商。

二是數據治理,城市數據湖提供數據清洗、加工、處理、分析等服務,同時是大數據加工工場。數據資源管理平臺、政務數據共享交換平臺、政務數據盤查工具、圖譜分析引擎、離線遷移工具等,實現數據抽取、數據清洗、數據編目、數據轉換、紙質檔案數字化、數據快遞。

三是數據應用,大數據創新應用產品及應用場景解決方案的製造商。數據湖體系創新產品研發包括:光磁電融合數據湖存儲平臺、數據資源管理平臺、城市視頻資源管理平臺、湖盤產品、數據湖運營平臺及數據湖運維管理平臺、AI開放平臺、DL-STORE、標註平臺和集。各產品旨在利用各類尖端技術,為用戶提供海量數據存儲、數據分析、數據管理、數據開放、人工智能應用等大數據服務,以及城市駕駛艙、交通大腦、公安大腦、視圖庫、“數據湖+醫療”、“數據湖+教育”“數據湖+防疫抗疫”等應用解決方案,使數據湖真正成為城市不可或缺的大數據基礎平臺設施。

四是AI服務,“算法商店”。通過AI算法推理平臺、AI算法訓練平臺、機器學習建模平臺、數據標註平臺、算法解析服務、文本智能分析平臺、城市視頻管理平臺等,提供視頻AI服務、圖片AI服務、文檔AI服務、認知計算等。

五是數據交易,數據銀行。數據湖一面擁有基礎設施的屬性,一面擁有著數據銀行的屬性。在數據確權和隱私保護的基礎上,面向全社會提供數據受託存儲、受託治理、受託分析等第三方數據融通服務。採用類銀行的經營模式、商業理念和管理方法,運用區塊鏈等技術,建設數據資產流通管理和運營平臺,打造各類數據運用產品,面向政府、企業和個人,提供數據價值評估、數據存貸、數據交易中介等服務。

簡言之,數據湖解決了以下幾個問題:

海量數據的存儲問題—建湖

數據溪流的匯聚—引水

數據的處理、分析與應用、數據資源化—水資源利用

滿足不同客戶需求、數據資產化—數據增值、變現

同時,數據湖創新性地提出並踐行數據產業發展的“五化理論。大數據時代,巨量信息與移動終端升級帶來數據資源的碎片化應用,以及導致不完整、不全面的數據價值挖掘結果。政府和企業只有通過打通數據壁壘,建立全面化的數據關聯分析,推動數據的規模化應用,完善數據產權保護制度,實現數字的資產化管理和開展數據證券化業務,才能使數據價值得以有效發揮,將數字資產作為數字經濟發展的關鍵生產要素,驅動數字產業化生態良性發展。

城市數據湖—— 為“新基建”築基,為“數據要素市場”加料

圖2:數據湖:天上有云,地下有湖

城市數據湖,未來發展之路

未來數據湖的發展路線,是從提供社會大數據一級開發和存儲服務的數字經濟基礎設施,發展為數據銀行,進而通過大量的數據標註和算法開發打造“算法商店”,最終實現存儲介質到認知計算的進化,賦能湖內外“認知醫療、數字孿生城市、數字永生、智慧交通、智慧公安”等人工智能和大數據應用場景落地,使數據湖發展成為有深度數據挖掘和分析應用能力的城市級DT產品,助力區域數字經濟轉型。

為實現數據湖從基礎設施向數據銀行、認知計算的進化,需要通過開展雲計算、湖存儲業務,夯實大數據採集、傳輸、存儲、分析、應用等數據鏈各環節的技術、產品和服務;通過開展城市大腦和數據增值業務,挖掘數據湖中長期存儲數據的二次分析價值,將海量、多源、異構的數據轉變為高價值、結構化的數據,為搭建數據交易市場,實現數據變現奠定基礎;通過開展數據安全服務,構建數據湖數據安全和隱私保護技術體系,為數據銀行的運行提供安全保障。

然而,我們也看到,目前我國數據要素市場化配置尚處於起步階段,在數據確權、開放共享、自由流通和數據安全等方面仍面臨諸多困難和阻礙。隨著相關配套措施的完善、政府數據開放共享的切實推進、數據要素市場的培育發展、數據資產管理的強化、數據要素治理體系的構建和不斷完善,城市數據湖的發展將迎來不可阻擋的“星星之火,燎原之勢”。


分享到:


相關文章: