走出大數據“迷思”,“非技術因素”才是關鍵!

■王智敏 於灝

兩個多月以來,艱辛的疫情防控雖還在鏖戰中,但一個基本的共識已經形成,那就是數據的及時獲取、分析、上報和預測對判斷疫情發展趨勢、打好武漢和湖北保衛戰是極其重要和無法代替的。

新聞報道中,相關負責人也特別強調,疫情防控要加強戰略謀劃、戰術實施,搭建大數據平臺、加強大數據分析,時刻心中有“數”,要發揮好大數據“顯微鏡”“透視鏡”“望遠鏡”的作用。

當前,大數據的發展及成效是有目共睹的,但從與時俱進的眼光看,創新和完善的空間始終存在,“取數難、用數難”的瓶頸始終制約著大數據價值的進一步挖掘。借鑑“戰疫前線”大數據應用的寶貴經驗,筆者就如何進一步用好大數據、走出大數據“迷思”提出幾點認識。

走出大數據“迷思”,“非技術因素”才是關鍵!

並非“只有數據完備才能做事”

疫情的“數據”防控工作集中反映的問題是欠缺真實、準確、及時的數據,比如由於數據採集不規範、數據不精準、標準不統一、報送不及時、多頭要報表、統計口徑經常調整等問題,使得通過數據分析來“放大”背後的問題成因以達到“見微知著”變得困難重重,也似乎使“顯微鏡”的作用失靈。

但實際情況是,無論付出多少代價,這樣的問題將永遠存在,差別只是程度輕重問題。因此,真正要面對的恰恰是這種情況下,如何提升“顯微鏡”的抗干擾能力。而這樣的能力提升也就意味著數據分析不能只是對數據質量“坐享其成”,其本身的分析方法和工具等,也要具備“慧眼”能力。

所謂錯誤的數據是人為定義的,它能夠被收集,就說明它是自然的、中性的,沒有對錯之分。只是數據分析不能靠加減乘除簡單地一望便知,而是要回溯數據收集過程的“扭曲”機理,這就是為什麼有實踐經驗和實踐悟性的大數據人才在數據分析中會變得越發重要的原因,這種實踐能力會讓我們識別所謂的錯誤數據,是經過什麼樣的“行為加工”所致。這必定是一個需要反覆甄別討論的過程,而不是一上來就拿起數據投入“算法”。

“非技術因素”反而對大數據平臺起決定性作用

本次疫情中,公安、衛健、民航、鐵路、電信等數據資源的集中效率極高,沒有司空見慣的數據壁壘和壟斷問題,這也為實現疫情排查、追蹤傳染源、疫情擴散預警等場景應用提供了重要的數據支撐。但同時似乎在強化一個已獲得普遍認同的結論,即似乎只要大數據平臺建成,就可“畢其功於一役”。

但現實並非如此,各類數據天然的“自成體系”非常容易造成相互之間“難以理解、難以溝通”。同時,平臺之所以難整合,本質上是難在利益,包括權力的整合,而且一些平臺最終不了了之,多因只看到平臺的技術特徵和技術優勢,沒有注意到“非技術因素”反而是在起決定性作用。

另外,數據之所以有“透視鏡”功能,簡言之就是擁有“透過現象看本質”的能力,這樣的能力發揮最終還是要依賴數據專家的分析水平,就像刑偵案件的證據與類似李昌鈺的刑偵高手。如果不重視培養專家人才,用好專家人才,僅靠“數據集中”的辦法實現透視功能,無疑會陷入“數據惰性”,即只單純依靠不斷“數據輸血”解決問題,殊不知實際解決數據問題的真正能力卻在退化。

基於現實的數據分析才是真正的“心中有數”

有觀點認為,數據集成及智能化技術的分析應用不足,是使大數據“望遠鏡”作用發揮不充分的主要原因。

此次疫情中,由於數據貫通、數據集成等基礎工作的不足,以及利用人工智能、數據挖掘等先進技術的靈活性不夠,大數據未能充分發揮對疫情峰值、拐點、擴散區域等相關內容預測研判的功能,以致出現疫情時防控措施準備不充分、防疫物資儲備調配不及時等現象。

這些現象確實可以從實際當中觀察得到,但問題是,即便具備數據技術運用的能力,“疫情防控措施準備不充分、防疫物資儲備調配不及時”的問題就能得到解決嗎?

如果說後者的操作要依賴於一線忙碌的人們,那麼前者就是坐在寫字樓裡擺弄鼠標的人們,他們之間該有多大的“鴻溝”?

真正的“望遠”恰恰不是離開現實有多遠,而是數據工作者沉下去,把現場一線作為數據分析的“大舞臺”,只有讓那些傳播動力學模型、動態感染模型、迴歸模型等大數據模型和技術鮮活起來,才能對趨勢研判真正“心中有數”,及時發現隱患點和薄弱點,洞察重點和難點,這樣的數據分析對決策的支撐才能稱得上是有效的。

(作者供職於國網能源研究院能源數字經濟研究所)

關於我們

《中國城市能源週刊》由人民日報社主管主辦,中國能源報社與國網(蘇州)城市能源研究院聯合出版;是中國城市能源變革產業發展聯盟的核心刊物。

於2019年3月4日正式創刊,全綵,雙週刊,每期4個版面,每週一出版,隨《中國能源報》發行。通過行業組織和權威媒體互動的平臺連接力、專業的輿論引導力,打造城市與能源的輿論高地,引領城市能源轉變走品牌化道路。逐步形成報紙、網站、微信為一體的融媒體新聞載體。


分享到:


相關文章: