梅宏院士:我國大數據總量有望佔全球兩成,應用尚處於初級階段

十三屆全國人大常委會第十四次會議10月26日下午在北京人民大會堂閉幕。會後,十三屆全國人大常委會舉辦專題講座第十四講,題目為《大數據:發展現狀與未來趨勢》。

中國科學院院士、中國人民解放軍軍事科學院副院長梅宏認為,當前大數據應用尚處於初級階段,根據大數據分析預測未來、指導實踐的深層次應用將成為發展重點。

他指出,預計到2020年,我國數據總量有望佔全球數據總量的21%,但我國核心技術薄弱,建議以開源為基礎構建自主可控的大數據產業生態。

梅宏院士:我国大数据总量有望占全球两成,应用尚处于初级阶段

大數據應用三個層次

梅宏指出,按照數據開發應用深入程度的不同,可將眾多的大數據應用分為三個層次。

第一層,描述性分析應用,是指從大數據中總結、抽取相關的信息和知識,幫助人們分析發生了什麼,並呈現事物的發展歷程。

如美國的DOMO公司從其企業客戶的各個信息系統中抽取、整合數據,再以統計圖表等可視化形式,將數據蘊含的信息推送給不同崗位的業務人員和管理者,幫助其更好地瞭解企業現狀,進而做出判斷和決策。

第二層,預測性分析應用,是指從大數據中分析事物之間的關聯關係、發展模式等,並據此對事物發展的趨勢進行預測。

如微軟公司紐約研究院研究員David Rothschild通過收集和分析賭博市場、好萊塢證券交易所、社交媒體用戶發佈的帖子等大量公開數據,建立預測模型,對多屆奧斯卡獎項的歸屬進行預測。2014和2015年,均準確預測了奧斯卡共24個獎項中的21個,準確率達87.5%。

第三層,指導性分析應用,是指在前兩個層次的基礎上,分析不同決策將導致的後果,並對決策進行指導和優化。

如無人駕駛汽車分析高精度地圖數據和海量的激光雷達、攝像頭等傳感器的實時感知數據,對車輛不同駕駛行為的後果進行預判,並據此指導車輛的自動駕駛。

自動駕駛有效應用面臨挑戰

梅宏認為,當前,在大數據應用的實踐中,描述性、預測性分析應用多,決策指導性等更深層次分析應用偏少。

一般而言,人們做出決策的流程通常包括:認知現狀、預測未來和選擇策略這三個基本步驟。這些步驟也對應了上述大數據分析應用的三個不同類型。

不同類型的應用意味著人類和計算機在決策流程中不同的分工和協作。例如:第一層次的描述性分析中,計算機僅負責將與現狀相關的信息和知識展現給人類專家,而對未來態勢的判斷及對最優策略的選擇仍然由人類專家完成。應用層次越深,計算機承擔的任務越多、越複雜,效率提升也越大,價值也越大。

然而,隨著研究應用的不斷深入,人們逐漸意識到前期在大數據分析應用中大放異彩的深度神經網絡尚存在基礎理論不完善、模型不具可解釋性、魯棒性較差等問題。

因此,雖然應用層次最深的決策指導性應用,當前已在人機博弈等非關鍵性領域取得較好應用效果,但是,在自動駕駛、政府決策、軍事指揮、醫療健康等應用價值更高,且與人類生命、財產、發展和安全緊密關聯的領域,要真正獲得有效應用,仍面臨一系列待解決的重大基礎理論和核心技術挑戰。

梅宏指出,在此之前,人們還不敢、也不能放手將更多的任務交由計算機大數據分析系統來完成。這也意味著,雖然已有很多成功的大數據應用案例,但還遠未達到我們的預期,大數據應用仍處於初級階段。

未來,隨著應用領域的拓展、技術的提升、數據共享開放機制的完善,以及產業生態的成熟,具有更大潛在價值的預測性和指導性應用將是發展的重點。

工業互聯網政府熱、企業冷

作為人口大國和製造大國,我國數據產生能力巨大,大數據資源極為豐富。

梅宏指出,預計到2020年,我國數據總量有望達到8000EB(1018),佔全球數據總量的21%,將成為名列前茅的數據資源大國和全球數據中心。

然而,我們也必須清醒地認識到我國在大數據方面仍存在一系列亟待補上的短板。

其中較為突出的是核心技術薄弱,基礎理論與核心技術的落後導致我國信息技術長期存在“空心化”和“低端化”問題,大數據時代需避免此問題在新一輪發展中再次出現。

近年來,我國在大數據應用領域取得較大進展,但是基礎理論、核心器件和算法、軟件等層面,較之美國等技術發達國家仍明顯落後。

在大數據管理、處理系統與工具方面,我國主要依賴國外開源社區的開源軟件,然而,由於我國對國際開源社區的影響力較弱,導致對大數據技術生態缺乏自主可控能力,成為制約我國大數據產業發展和國際化運營的重大隱患。

梅宏建議採用“參與融入、蓄勢引領”的開源推進策略,一方面鼓勵我國企業積極“參與融入”國際成熟的開源社區,爭取話語權;另一方面,也要在建設基於中文的開源社區方面加大投入,匯聚國內軟硬件資源和開源人才,打造自主可控開源生態,在學習實踐中逐漸成長壯大,伺機實現引領發展。

此外,融合應用有待深化。梅宏指出我國大數據與實體經濟融合不夠深入,主要問題表現在:基礎設施配置不到位,數據採集難度大;缺乏有效引導與支撐,實體經濟數字化轉型緩慢;缺乏自主可控的數據互聯共享平臺等。

當前,工業互聯網成為互聯網發展的新領域,然而仍存在不少問題:政府熱、企業冷,政府時有“項目式”、“運動式”推進,而企業由於沒看到直接、快捷的好處,接受度低;設備設施的數字化率和聯網率偏低;大多數大企業仍然傾向打造難以與外部系統交互數據的封閉系統,而眾多中小企業數字化轉型的動力和能力嚴重不足;國外廠商的設備在我國具有壟斷地位,這些企業紛紛推出相應的工業互聯網平臺,搶佔工業領域的大數據基礎服務市場。

梅宏建議大力發展行業大數據應用。以製造業為例,麥肯錫研究報告稱:製造企業在利用大數據技術後,其生產成本能夠降低10%—15%。

而大數據技術對製造業的影響遠非成本這一個方面。利用源於產品生命週期中市場、設計、製造、服務、再利用等各個環節數據,製造業企業可以更加精細、個性化地瞭解客戶需求;建立更加精益化、柔性化、智能化的生產系統;創造包括銷售產品、服務、價值等多樣的商業模式;並實現從應激式到預防式的工業系統運轉管理模式的轉變。

更多內容請下載21財經APP


分享到:


相關文章: