檔案館也是“大數據庫”

檔案館也是“大數據庫”

牛皮紙袋、泛黃案卷紙片、鐵質文件櫃……這是檔案館的昨天,在萬物互聯、人工智能的時代,越來越多的傳統檔案館正在變身為充滿科技因子的“大數據庫”。

『檔案館,在傳統認知中是一座塵封歷史記憶的神秘寶庫,人們想象著庫房厚重的大門背後鎖藏著多少不為人知的史實。

牛皮紙袋、泛黃案卷紙片、鐵質文件櫃……在普通人的印象中,組成了檔案館的元素標配。然而,在萬物互聯、人工智能的時代,越來越多的傳統檔案館開始轉變。它們逐步變身為充滿科技因子的“大數據庫”。那些泛黃紙片、老舊膠捲、手寫文本一一被數字化,以電子文檔的樣貌留存時光。

無論是西方傳說中司檔案的雅努斯神,還是被我們尊為檔案界“老祖宗”的司馬遷,可能都無法想象歷史變遷下的檔案工作會迎來如此鉅變。但是,檔案館到底要不要成為“大數據庫”?如同當年討論電子閱讀和紙質閱讀的關係那樣,大家依然眾說紛紜。』

▇ 開放利用還是劃控管理

近日,重讀塗子沛《大數據:正在到來的數據革命》一書,頗有啟發。這本書通過講述美國半個多世紀信息開放、技術創新的歷史,以奧巴馬建設“前所未有的開放政府”、《數據質量法》背後的隱情、統一身份證的百年糾結等案例,細解數據創新不僅推動商業智能革命,而且將對政府職能轉變、社會治理、公民生活方式等帶來更多變革與挑戰。

書中還生動講述了政府信息逐步開放過程中,圍繞大數據資源的各種新舊思想衝突、部門數據資源的利益博弈,以及政府、企業、社會之間的立場紛爭等,對於把握大數據環境下推動檔案公共服務等提供了教訓和借鑑。

文中有一段話,讀來猶有感觸:“從古至今,所有政府,都帶有保密、封閉的文化基因。雖然一談到透明和開放,大部分人都會認可這是正確的價值觀,但一旦要自己透明、要自己開放,那開放和透明就立刻變成了一種威脅。面對龐大的公共信息,政府首腦的第一反應往往是安全第一、保密第一,具體到一線工作人員,也是‘多一事不如少一事’,直接打上‘保密’的標籤,最為簡單省事。”

文中還談到了建立開放數據平臺的種種爭議,包括原始數據之爭、數據安全之爭、數據質量之爭、數據粒度(數據的細化和綜合程度)之爭、數據價值之爭、網站虛實之爭等。自2015年我國邁入大數據時代開始,政府大數據平臺加快建設,類似爭議在檔案界業內也是甚囂塵上。雙套制還是單套制?數字化的檔案資源是不是公共數據?開放利用還是劃控管理?這些問題雖然不能直接從書裡找到明確答案,但也能有一些類比參考。

▇ 別成為故紙堆的“墳墓”

數據驅動的智能時代已經到來。沒有大數據思維,只能被時代淘汰。

毋庸置疑,我們已經身處一個信息技術高速發展的時代。在這個嶄新的時代,不僅新技術更新迭代迅速,而且政治、經濟、社會、文化等在信息技術滲透下都在發生深層次變革。“萬物皆聯網、無處不計算”成為現實。雲計算、區塊鏈、人工智能……這些詞語不再只是科技術語,而已成為現實生活中看得見、摸得著的應用。

在大數據應用的滋養下,“互聯、共享、系統、關聯”的大數據思維逐步成為社會共識。檔案工作當然不能置身事外。如果檔案館裡只能存放紙質檔案,而忽視了對越來越多的電子檔案的管理工作;如果檔案工作者看不到檔案的大數據價值,而僅僅把現有館藏的幾百萬卷(件)紙質檔案作為塵封記憶,那麼檔案館也許有一天將面臨無檔可歸的地步,或者真將成為故紙堆的“墳墓”:一方面,放棄了對當下最為活躍、最為生動的歷史的記錄;另一方面,也失去了活化和開發檔案價值的有效手段和空間。

因此,存量數字化、增量電子化,理應成為一個共識。不僅檔案界應當更加迅速地行動起來,社會各個領域也應當把廣泛建立數字檔案室、數字檔案館作為重要工作。不然,那些電腦裡的電子文檔、設計室裡的數據圖紙、數據庫裡的表格視圖,恐怕都將無跡可尋,成為歷史塵埃。

公共數據開放利用是社會進步所需,選擇故步自封、墨守成規終將輸給歷史。實踐證明,開放的經濟、開放的社會和開放的政府是人類社會得以進步的基礎。近年來,我國高度重視政府數據開放利用工作。以往各自封閉、互不聯通的數據資源得到整合和提升,成為服務社會、服務人民與推動發展的重要動能。

習近平總書記指出,加快政府大數據平臺建設是提高社會治理能力和水平的迫切要求。各級黨委和政府要強化互聯網思維,善於利用互聯網優勢,著力在融合、共享、便民、安全上下功夫。同時,進一步拓展為長三角異地查詢服務,推動區域檔案數字化提檔增速與共享互聯。

當然,並非所有的檔案都是可開放利用的公共數據。相當一部分檔案具有保密性、隱私性、敏感性等特點,需要依法依規予以嚴格劃控和管理。這是由檔案天然所具有的政治屬性、機要屬性所決定的。但這並不是把檔案工作和大數據割裂開來的理由。許多檔案特別是民生檔案取之於人民、產生於基層,在依法合規的前提下,應當作為公共信息和數據予以開放利用。

檔案,從來都是緊跟時代而發生形態變遷的。結繩記事、石刻碑銘、金帛絹書、文案卷牘……無不是檔案記錄原始和真實的載體。如今,大數據時代又為檔案工作賦予了新的數據能量。在大數據的視野下,各級各類檔案史志館不僅僅是一座史料寶庫,而且會成為一個海量字節的“大數據庫”。

档案馆也是“大数据库”

《大數據:正在到來的數據革命》

塗子沛 著

廣西師範大學出版社


分享到:


相關文章: