政府數據開放註冊管理元數據研究

4.2 其他詞彙表的複用

為增強描述能力, 同已有的描述體系保持一致, 各元數據標準都儘可能複用已有的詞彙表。在制定我國政府數據註冊管理元數據標準時, 可複用的元數據標準主要來自5個方面: (1) W3C推薦的元數據標準。W3C制定了很多專業化元數據標準, 且已被廣泛採用, 上述詞彙表中FOAF、SKOS等均來自於W3C。 (2) 本地相關的元數據標準。如美國在DCAT基礎上加入地理信息元數據標準CSDGM。 (3) 軟件工具標準。使用CKAN軟件在搭建政府數據開放平臺時, 需要考慮CKAN的元數據元素。 (4) 元數據格式標準。美國政府數據集的註冊管理元數據主要使用JSON格式, POD v1.1中的@context、@id、@type均來自JSON-LD的關鍵字。 (5) 其他元數據標準。

4.3 對已有元數據描述方案的分析

通過對錶3中所列數據元數據描述項進行分析, 發現主要存在以下特點。

(1) 已有的地方政府開放數據描述方案僅建立簡單的描述項, 描述能力十分有限, 只承擔基本數據描述職能, 甚至缺少必要描述項, 如時間範圍等。

(2) 已有的數據描述方案基本沒有規定數據取值範圍。如北京市的數據描述項中“資源類型”, 並沒有關於“資源類型”取值的嚴格規定, 雖然取值有“表格”, 但“表格”不是一種數據格式, 有CSV、XLS等不同類型格式。

(3) 不同地方政府開放數據描述方案中主要的描述項基本相同, 但其使用的標籤並不完全一致, 數據項也不盡相同。在規範的描述體系中, 相同的描述項應儘量統一, 而不是藉助屬性映射完成互操作, 特殊的屬性要求應在統一規範的擴展機制約束下實現。

(4) 由於現有數據描述方案只考慮基本的屬性描述職能, 所以在設計時並沒有完全參照已有規範, 如DCMI。由於這些描述方案均較簡單, 所以在制定通用的數據描述規範時, 可以方便地將已有的描述項納入規範體系, 並對現有描述數據進行轉換處理。

政府数据开放注册管理元数据研究

表3 已有的地方政府開放數據元數據描述項

5、結語

政府數據的有效開放和充分交換需要對其進行註冊管理, 而元數據標準是註冊管理和政府數據開放的重要基礎。科學的元數據標準有利於數據集的有序組織, 數據集元數據採集和交換, 更有利於被數據集使用者發現和使用, 提高數據集的使用效率。但是, 目前我國地方政府數據開放平臺的元數據標準化、規範化程度較低, 數據集描述項較少, 制約政府數據開放的推進和發展。本文從註冊管理角度出發, 研究了國外政府數據開放標準DCAT、POD和DCAT-AP基本結構和數據項, 認為我國政府數據開放註冊管理元數據規範應滿足未來需求的變化, 具有靈活的描述體系。本研究還對我國規範應包含的強制類、推薦類、可選類, 以及各地方政府在具體應用該規範的擴展原則做出說明, 以滿足不同地方政府對數據描述的不同需求。政府數據開放註冊管理元數據經過標準化、規範化建設, 可進行跨國家、跨地區間的元數據交換, 從而實現更大範圍的政府數據共享, 產生更大的經濟和社會效益。

參考文獻:略


分享到:


相關文章: