4.2 其他詞彙表的複用
為增強描述能力, 同已有的描述體系保持一致, 各元數據標準都儘可能複用已有的詞彙表。在制定我國政府數據註冊管理元數據標準時, 可複用的元數據標準主要來自5個方面: (1) W3C推薦的元數據標準。W3C制定了很多專業化元數據標準, 且已被廣泛採用, 上述詞彙表中FOAF、SKOS等均來自於W3C。 (2) 本地相關的元數據標準。如美國在DCAT基礎上加入地理信息元數據標準CSDGM。 (3) 軟件工具標準。使用CKAN軟件在搭建政府數據開放平臺時, 需要考慮CKAN的元數據元素。 (4) 元數據格式標準。美國政府數據集的註冊管理元數據主要使用JSON格式, POD v1.1中的@context、@id、@type均來自JSON-LD的關鍵字。 (5) 其他元數據標準。
4.3 對已有元數據描述方案的分析
通過對錶3中所列數據元數據描述項進行分析, 發現主要存在以下特點。
(1) 已有的地方政府開放數據描述方案僅建立簡單的描述項, 描述能力十分有限, 只承擔基本數據描述職能, 甚至缺少必要描述項, 如時間範圍等。
(2) 已有的數據描述方案基本沒有規定數據取值範圍。如北京市的數據描述項中“資源類型”, 並沒有關於“資源類型”取值的嚴格規定, 雖然取值有“表格”, 但“表格”不是一種數據格式, 有CSV、XLS等不同類型格式。
(3) 不同地方政府開放數據描述方案中主要的描述項基本相同, 但其使用的標籤並不完全一致, 數據項也不盡相同。在規範的描述體系中, 相同的描述項應儘量統一, 而不是藉助屬性映射完成互操作, 特殊的屬性要求應在統一規範的擴展機制約束下實現。
(4) 由於現有數據描述方案只考慮基本的屬性描述職能, 所以在設計時並沒有完全參照已有規範, 如DCMI。由於這些描述方案均較簡單, 所以在制定通用的數據描述規範時, 可以方便地將已有的描述項納入規範體系, 並對現有描述數據進行轉換處理。
![政府数据开放注册管理元数据研究](http://p2.ttnews.xyz/loading.gif)
表3 已有的地方政府開放數據元數據描述項
5、結語
政府數據的有效開放和充分交換需要對其進行註冊管理, 而元數據標準是註冊管理和政府數據開放的重要基礎。科學的元數據標準有利於數據集的有序組織, 數據集元數據採集和交換, 更有利於被數據集使用者發現和使用, 提高數據集的使用效率。但是, 目前我國地方政府數據開放平臺的元數據標準化、規範化程度較低, 數據集描述項較少, 制約政府數據開放的推進和發展。本文從註冊管理角度出發, 研究了國外政府數據開放標準DCAT、POD和DCAT-AP基本結構和數據項, 認為我國政府數據開放註冊管理元數據規範應滿足未來需求的變化, 具有靈活的描述體系。本研究還對我國規範應包含的強制類、推薦類、可選類, 以及各地方政府在具體應用該規範的擴展原則做出說明, 以滿足不同地方政府對數據描述的不同需求。政府數據開放註冊管理元數據經過標準化、規範化建設, 可進行跨國家、跨地區間的元數據交換, 從而實現更大範圍的政府數據共享, 產生更大的經濟和社會效益。
參考文獻:略
閱讀更多 國脈智庫 的文章