模型丨基於知識融合的電子政務知識服務模式及系統模型

摘要:針對當前政府大數據存在多源化、異構化、碎片化及價值密度低等問題, 給電子政務知識服務帶來巨大挑戰。知識融合能解決多源、異構的知識優化重組問題, 提高電子政務知識服務質量。首先, 對知識融合及其相關研究進展進行了理論回顧, 探討了大數據環境下電子政務知識服務的內涵、基本特徵, 分析電子政務知識服務對知識融合的現實需求;其次, 提出了基於知識融合的電子政務知識服務模式, 構建了基於知識融合的電子政務知識服務系統模型, 並對系統模型進行分析;最後, 總結了研究侷限與展望。

引言

大數據存在體量大、多源化、異構化、碎片化、價值密度低等特點, 在一定程度上提升了電子政務知識服務的效率和質量, 豐富了電子政務知識服務的內涵和手段, 同時, 也給電子政務知識服務帶來了新的挑戰。大數據環境下, 如何提高電子政務知識服務質量, 從而為政府決策者提供精準的、個性化知識服務解決方案, 成為電子政務知識服務研究領域的熱點和難點。

知識融合通過滿足用戶個性化的知識需求來提高知識服務質量, 促進知識共享、知識交互和業務協同, 實現知識創新, 可幫助管理決策者找尋組織內外部知識間的潛在的、隱形的某種關聯, 發現被忽略的因素, 從而為決策者提供精準化、個性化知識服務和解決方案, 是大數據環境下進行知識獲取、組織和利用的有效途徑。

1、理論綜述與研究進展

1.1 知識融合及其研究進展

知識融合 (Knowledge Fusion) 最早於20世紀90年代初被提出, 是在知識聚合、信息融合、數據集成等研究的基礎上提出的新概念。著名情報學者邱均平等人認為, 根據知識來源的不同, 將知識融合研究劃分為兩類:其一, 知識融合是信息融合發展的高級階段, 是信息融合衍生而來, 主要指從物理層獲得的數據轉化而來的信息, 軍事、醫學、工程學科學者是其主要研究力量;其二, 知識融合是知識管理視角下的知識融合, 主要是從知識庫、網絡文本數據庫中抽取而來的知識, 管理科學、圖書情報學、計算機科學等學者是其主要研究力量。國外研究方面, 可以發現國外學者對知識融合進行了大量的研究, 從工程學科、計算機科學等學科視角研究知識融合仍然佔據主導地位, 從圖書館信息科學 (LIS) 學科視角研究知識融合在近年逐漸興起, 知識融合主題引起了圖書館信息學界的極大關注。從知識融合研究內容分析, 涵蓋了算法研究、系統研究、框架研究、應用研究和實證研究。理論研究包括基於語義理解的知識融合、基於貝葉斯網絡的知識融合等研究領域;應用研究則覆蓋面向網格環境的知識融合、面向企業知識的知識融合等方面。國內方面, 國內學者研究知識融合問題, 多偏重於應用層, 強調輔助決策支持、提升知識服務質量。從研究主體看, 計算機科學等學科背景的學者仍佔主流, 圖書情報學領域的研究者相對較少, 關注領域集中於參考諮詢、協同標註及大數據、關聯數據環境下的知識融合。如唐曉波等人探討了大數據環境下的知識融合框架模型, 高勁松等人提出了基於關聯數據的知識融合模型, 沈旺等人提出數字參考諮詢知識融合框架, 該框架有利於解決異構數據的結構異構性、語義矛盾性等問題。

1.2 電子政務知識服務內涵及研究進展

電子政務知識服務, 是以政務信息知識的識別、獲取、組織、存儲、挖掘的能力為基礎, 根據用戶的問題描述和所處環境, 融入用戶解決問題的過程之中, 提供能夠有效支持政務知識應用和知識創新的服務。大數據環境下知識總量的增加, 公眾用戶關注的不僅僅是政務信息的搜尋、獲取, 更多地關注如何利用知識解決問題, 如何獲取能解決問題或提供個性化解決方案的的知識。電子政務知識服務要求對分佈式的、異構多源的政府數據資源進行集成和整合, 通過建立數字化知識服務平臺, 建設業務應用系統, 構建電子政務知識服務體系, 對內滿足政府管理和政府決策需求, 對外滿足公眾對信息、知識和服務的需求, 實現知識應用和知識創新, 最終提高政府的管理決策效率和服務能力。與其他類型知識服務不同的是, 電子政務知識服務具有很強的公共性, 其最終目的在於提高政府行政的效率和能力, 輔助政府決策, 提高公共服務的質量。

近年來, 國內學者對電子政務知識服務領域的相關研究, 聚焦於服務模式和技術實現等領域。研究內容主要涉及基於網格的電子政務知識服務、基於用戶興趣聚類的電子政務知識服務、基於門戶網站的電子政務知識服務等方面。如柳巧玲提出了一種基於知識網格技術的電子政務知識服務平臺, 伍革新等人設計了基於用戶興趣聚類的電子政務知識服務平臺模型, 並開展了具體實證分析, 徐晨琛提出了基於門戶網站的電子政務知識服務模式, 並構建了電子政務知識服務平臺, 馬海群等人提出支撐知識產權電子政務的知識服務。

在關鍵技術實現方面, 國內學者逐漸聚焦電子政務知識服務的技術實現、平臺搭建等研究領域。研究主題主要集中在本體、語義Web、主題圖、知識網格等相關技術層面探索在電子政務知識服務中的引用, 以及搭建電子政務知識服務系統平臺、構建知識服務框架體系等方面, 取得了一定的研究成果。知識融合能提高電子政務知識服務的效率和質量, 但就大數據環境下基於知識融合的電子政務知識服務模式、系統模型以及技術實現等領域的相關研究甚少涉及, 亦缺乏相關代表性研究成果。

2、大數據環境下的電子政務知識服務

2.1 大數據知識服務與傳統知識服務

大數據環境下, 數據總量及數據庫數量呈指數級增長, 知識爆炸和數據氾濫成為大數據時代的顯著特徵。如何從海量的、紛繁複雜的數據中提取出能夠面向用戶服務和決策需要的知識、開發並挖掘出知識的巨大價值, 進而使這些知識能解決現實問題或提供問題解決方案, 從而科學、高效的利用這些知識, 開展高質量、高效率的知識服務, 成為擺在各知識服務機構面前亟待解決的難題。

傳統知識服務過程中的關鍵問題在於用戶的需求分析 (包括用戶真正需要的是什麼, 知識服務內容和服務方式是什麼, 如何實現知識服務的自適應性和可擴展性) ;知識的提取和發現 (如何提高現有知識的價值並推導出更多的知識, 從而進行知識創新) ;知識的表示和建模 (如何構建知識模型和表示知識, 以便系統能夠容易理解、處理和應用知識, 對於動態隱形的知識, 如何進行表達和轉化) ;如何進行知識管理以便於用戶進行檢索和利用、如何突破知識共享的障礙、用什麼樣的技術解決方案以及如何實現知識共享平臺等方面。

大數據知識服務與傳統知識服務的區別在於, 大數據知識服務是用以解決結構化、半結構化和非結構化數據的知識服務新模式, 是面對海量的、動態的、異構的信息源, 提取有效的、未知的、最終可理解的知識, 特別強調用戶參與, 將用戶參與滲透到用戶的精準需求及知識服務的全生命週期管理的每一個環節。一方面, 大數據知識服務共享的是服務資源, 知識、能力和服務過程;另一方面, 大數據知識服務, 不僅包括對移動狀態數據的獲取、存儲、組織、利用等過程進行管理, 而是將計算、知識和服務推向數據, 在相應的知識庫、專家庫、數據處理模型及框架的支持下, 實現大數據獲取、存儲、組織、利用等過程中的知識、能力、資源和過程的全面共享和交易。大數據環境下的知識服務主要用以解決結構化、半結構化和非結構化數據的多維度數據處理需求, 更多強調知識、能力、資源和過程以服務的形式進行有機融合, 是嵌入式協作化知識服務模式的新發展。大數據環境下, 面對動態、海量、異構信息源, 如何提取有效的、未知的、最終可理解的知識成為知識服務的關鍵問題, 數據挖掘技術幫助用戶發現了隱性知識, 實現了知識共享;而知識融合技術則幫助用戶解決了分佈式、異構、多源異構數據源的集成。

2.2 大數據下電子政務知識服務及其特徵

大數據環境下的電子政務知識服務要求其對分佈式的、異構的、碎片化、多源化的政府信息資源進行統一整理和深度整合, 實現由數據庫向知識庫的轉變, 建立政務知識共享、交互和服務平臺, 建立協同作業的業務應用系統, 構建電子政務知識服務平臺, 為實現政務知識語義層面的檢索提供依據, 為電子政務一站式、集成式服務打下基礎。具體而言, 大數據環境下電子政務知識服務具有以下特點:

(1) 不確定性的知識服務。大數據下的電子政務知識服務對於公眾用戶的知識需求滿足並不是提供唯一的解決方案, 而是一組解決方案集合。社會公眾或企業用戶通過電子政務知識服務平臺提出個性化的知識服務需求, 政府利用大數據技術和方法, 依據社會公眾用戶大數據需求, 形成政務知識服務解集合, 並部署政務知識服務實施方案。大數據知識服務平臺通過基於語義理解的知識服務匹配技術、知識融合算法技術、智能優化技術等, 從大數據知識服務解集合中, 選擇合適的服務參與組合, 並優選和組合出最佳的一組解決方案來實現用戶的知識服務請求。

(2) 精準化的知識服務。大數據為電子政務知識服務提供了豐富、海量的政府數據資源和專業的數據分析技術 (如Hadoop) 、全新的問題解決方案和思維方式, 從而使得電子政務知識服務成為一種面向社會公眾用戶需求和為用戶提供個性化解決方案的服務, 更加註重個性化、精準化地向社會公眾用戶提供解決問題的知識、支持公眾用戶參與社會管理、科學決策過程或為其提供精準化的解決方案。

2.3 電子政務知識服務對知識融合的現實需求

知識融合通過對分佈式數據庫、知識庫和數據倉庫等信息源進行智能化處理, 對知識進行轉化、集成和融合, 其本質就是多源異構的知識優化重組問題, 目的就是實現知識創新。知識融合的價值就在於從眾多分散的、異構的數據源、知識源中挖掘出隱含在社會公眾用戶日常行為大數據中的有價值的、尚未被發現的信息和知識 (尤其是隱形知識, 如規則、方法、模型、技巧、經驗等) , 利用關聯數據和大數據分析等技術, 幫助政府決策者發現這些政務大數據之間潛在的某種關聯, 發現被忽略的隱形因素, 從而為某一社會公共事務領域問題的求解提供精準化、個性化、專業化的政務知識服務或問題解決方案。具體而言, 電子政務知識服務對知識融合的需求體現在:

(1) 來源多源化及結構異構性。大數據環境下, 數據來源除了傳統數據資源外, 還包含了更為豐富的新數據源, 如物聯網感知數據、企業商務交易數據、社交網絡數據、用戶行為數據等。此外, 越來越多的非結構化數據、半結構化數據呈海量增長, 採用的技術和語義也不同, 大數據環境下, 越來越多的非結構化數據、半結構化數據呈海量增長, 並且這些數據的組成結構、格式類型、存在狀態都愈加複雜, 這使得多源、異質、異構的數據的融合變得異常艱難, 數據類型的擴大化和數據結構的複雜化給數據處理帶來巨大挑戰。知識融合可以成為一種重要的操作和管理這些數據的有效工具, 知識融合通過融合數據資源, 建立數據平臺, 對內滿足政府管理和決策的需求, 對外滿足公眾用戶對政務信息、知識的個性化、精準需求。

(2) 形式碎片化和價值稀疏性。大數據環境下的知識融合不僅僅是針對某個專業領域內的數據單元和知識單元, 而且還包括建立知識與數據之間關聯關係 (特別是隱形關聯) 。同時, 數據激增帶來了大量不相關數據和低密度數據的存在, 給“知識”提純帶來難度。知識融合可實現分佈式知識庫中更多知識的交互, 利用融合算法技術和語義理解技術, 在知識單元間建立關聯或語義關係, 並將知識重組或整序, 去掉重複或無用的內容, 幫助用戶從大量繁雜的知識中快速獲取解決問題的知識。通過知識融合來整合各級機構後臺數據庫的碎片化政務數據, 提高知識價值、進行相互聯接、信息交換和服務的整合, 以便於更高質地為公眾提供知識服務。

3、基於知識融合的電子政務知識服務模式

3.1 基於電子政務的知識融合流程

知識融合結合知識表示、知識發現等技術手段來實現對知識的語義進行深度加工, 為大數據環境下精準化電子政務知識服務提供技術支撐。知識融合通過對多源異構數據進行提取出有效的、未知的、最終可理解的知識, 一般應用於集成式信息檢索領域, 包括分佈式、異構、多媒體數據源的集成。知識融合面向用戶需求和知識創新, 通過對眾多分散、多源、異構政務知識資源和政務大數據的獲取、採集、匹配、挖掘、集成、優化、分析等處理手段, 獲取隱含的或有價值的新知識, 同時, 優化知識的結構和內涵, 實現知識共享、知識創新、知識交互, 提供知識服務, 應用的主要方法與技術是本體、主體圖、語義網和關聯數據等。

基於電子政務的知識融合流程是面向公共服務和管理決策問題的, 以多源異構的政務大數據為基礎, 在政務本體庫和融合規則庫的支持下, 通過知識抽取和轉換獲取隱藏在政務大數據中的數據因子及其關聯關係, 進而在語義理解層面上進行組合、推理、創造出新知識的過程, 並且這個過程根據數據源的變化和用戶的反饋進行動態調整, 從而解決應對公眾服務和管理決策中的政府知識需求問題, 構成基於知識融合的整個流程 (如圖1所示) 。

模型丨基于知识融合的电子政务知识服务模式及系统模型

圖1 基於電子政務的知識融合流程

圖1中可以看出, 面向服務和決策的電子政務知識融合的任務開始於特定的用戶需求 (社會公眾的多樣化知識需求) 和應用問題, 最終的產出是能夠滿足用戶需求和解決實際應用問題的融合結果, 融合結果是從政務大數據中產生了新的政務知識, 或是產生了對解決特定問題有實際價值的政務知識。其中, 融合算法目標是通過某種可流程化實現的處理過程, 將已有的知識元素按照約定的規則進行比較、合併和協調等融合運算, 從而產生出新的可用知識對象內容並同時對原有知識元素進行優化。知識融合規則是實施知識融合算法的基礎, 規則庫的豐富性和準確性直接影響著融合的結果, 規則庫中包含著適應不同條件的融合規則, 為後續過程提供知識庫。

3.2 基於知識融合的電子政務知識服務模式

知識融合的價值就在於從大量多源、異構、動態、碎片化、不確定及價值稀疏的數據源、知識源中挖掘出隱含的、有價值的、尚未被發現的信息和知識。基於知識融合的電子政務知識服務更加註重向社會公眾用戶提供解決問題的知識服務, 支持政府用戶進行科學決策參考或提供精準的問題解決方案, 不僅僅幫助用戶獲取數據、事實等顯性知識, 同時也幫助用戶獲取具有創造性的隱形知識, 實現知識應用和知識創新, 在服務方式上, 更顯主動化和個性化。

知識融合主要是將不同地點、不同應用平臺的分佈式數據庫、知識庫及數據倉庫進行智能化轉化、集成和融合, 形成虛擬數據庫或雲服務平臺, 同時, 對不同業務部門的異構知識進行挖掘、整合、協同和集中, 構建電子政務知識庫。其中, 業務應用融合主要是分散的、異構的業務應用系統進行集成、交互、共享;服務融合主要以知識融合為基礎、以業務應用融合為平臺, 向用戶提供一站式、面向用戶需求和問題解決方案的知識服務。知識融合通過對分佈式數據源和知識源進行組織和管理, 結合應用需求對知識元素進行轉化、集成及融合處理, 從而獲取有價值或可用的新知識, 通過融合算法構建元知識集、本體知識庫及專題應用知識庫等, 實現政務知識的融合, 提供基於知識的服務。

以知識融合為基礎構建的電子政務知識服務平臺是一個大數據採集、組織、存儲、分析和麵向決策及用戶需求的智慧化平臺, 是在政府信息資源整合和共享平臺構建的基礎上, 是以知識集成為基礎, 以應用的集成為平臺, 通過數據挖掘、機器學習、知識發現、知識表示等相關技術, 促進“信息”向“知識”轉化, 促進顯性知識和隱性知識的轉化, 實現對知識的獲取、加工和開發利用, 並以電子政務知識服務平臺為載體, 向公眾用戶提供協同式、面向決策支持和問題解決方案的知識服務。這種服務模式是為適應電子政務知識服務智慧化、協同化、泛在化而衍生的一種基於Web的用於解決結構化、半結構化和非結構化數據多維處理的電子政務知識服務模式 (如圖2所示) 。

模型丨基于知识融合的电子政务知识服务模式及系统模型

圖2 基於知識融合的電子政務知識服務模式

圖2中, 知識融合和知識共享、知識集成之間有部分重疊內容。這是因為, 知識融合是與知識共享、知識集成等技術的共同點都是在知識層面進行處理, 都要對知識進行組織, 目的都是對政務知識庫進行優化和重用, 提高電子政務知識服務的效率和質量。區別在於知識融合是通過合適的算法模型產生基於現有知識為基礎的知識創新, 形成新的可利用的、有價值的新知識, 並且能夠應用反饋對新的知識進行合理評估, 從而提高電子政務協同工作的能力, 這是知識共享和知識集成所無法實現的。

知識融合通過對分佈式政務數據庫、政務知識庫和數據倉庫等信息源進行智能化處理, 採用轉換、集成、提取與合併等方法, 建立統一的知識表示模式並對顯形和隱性知識進行相互轉化、集成及融合, 實現知識創新, 以獲得有價值或可用的新知識, 這樣不同的電子政務系統之間可以實現知識的共享和業務的協同, 能夠對知識進行更好的組織和優化、提供適合的共享模式, 實現對電子政務知識庫本身的進一步知識挖掘, 從而產生出無法在數據層面挖掘到的新知識, 當知識庫構建完成之後, 可實現基於知識的各種應用服務。

4、基於知識融合的電子政務知識服務系統模型

4.1 平臺架構

電子政務知識門戶是實現電子政務知識服務的載體和平臺, 是數據集成、知識集成、應用集成和服務集成的統一。整個平臺系統架構可分為四個部分:基礎設施層、數據資源層、知識融合層、知識服務層。

基礎設施層為中間層或者用戶提供必要的硬件資源組成、所需的計算和存儲資源, 包括通訊系統、計算機系統和服務器等。

數據資源層主要負責數據和知識的集成。數據集成通過統一的標準, 將位於不同地點、不同服務器和不同應用平臺的各種異構數據在邏輯上或物理上進行集成, 以實現不同數據源的共享、交換、分析和呈現。知識集成就是將分散在不同的政府業務部門、不同地區的、異構的政府數據資源或知識進行業務協同和數據集成 (包括顯性知識和隱形知識的集成) 。同時, 採用雲計算技術、虛擬化技術將“政務雲”資源池化, 包括大量的政務數據、信息, 以此構建政務知識庫, 政務知識庫是儲存政務領域內的、可機讀格式表達的特定領域的抽象或特定知識的集合, 它是知識系統的知識模塊。政務知識庫有利於實現政務隱形知識向顯性知識的轉化和集成。政務知識庫要以公眾用戶的需求為導向來構建, 包括政務知識的識別與採集、知識的標識與序化、知識的加工與存儲、知識庫的維護和更新等步驟。政務知識庫以描述的方式來存儲和管理政務知識, 所有的知識都存儲在邏輯上統一知識庫中, 政務知識庫和本體庫的構建是知識融合的基石, 也是構成知識服務平臺的關鍵。

知識融合層負責將電子政務系統中多源的、異構的各類政務大數據 (包括結構化政務數據和非結構化政務數據) 進行轉化、匹配、集成和挖掘等, 從而實現知識融合。知識融合把孤立、分散的知識進行聯繫起來, 把分散、多源的知識進行集中化, 使混亂、無序的知識進行有序化, 使隱形知識顯性化、關聯化, 運用關聯數據技術, 從而在政務數據資源和社會公眾用戶之間建立有效的聯繫, 緩解政務大數據無限性與公眾用戶需求無法滿足之間矛盾。具體包括政務大數據獲取與知識表示 (通過政務大數據獲取、知識狀態空間的表示來構建知識庫) 、元知識集與統一知識模式構建 (解決數據體量大、異構的問題) 、知識融合算法的選擇、衍生知識處理 (包括語義分析技術實現語義匹配產生衍生知識庫) 等階段。

其中, 知識融合算法的設計與實現是實現多源知識融合的關鍵環節, 按照融合規則將分散異構的知識源融合成新的集成化知識對象, 構建解知識空間、向社會公眾用戶提供個性化、精準化知識服務。對於衍生知識庫中的知識, 通過機器學習、知識發現和知識融合算法等技術, 形成新的知識和融合規則, 構成動態的、反饋的知識融合系統, 實現知識的循環使用。同時, 根據公眾用戶需求與解知識空間進行匹配, 精準獲取公眾用戶所需的知識, 通過用戶接口反饋給用戶, 從而實現基於知識融合的政務知識服務, 通過機器學習進行衍生知識處理是提高知識融合性能的必要手段。

知識服務層主要實現政務知識的智能搜索、政務知識的推送等個性化服務, 通過智能搜索和過濾技術, 主動發現公眾用戶的知識需求和政務數據資源, 過濾冗餘知識。同時, 運用知識空間中衍生知識庫之間隱含的語義關係, 進行知識推理, 挖掘公眾用戶的隱形知識需求及知識之間的潛在的語義關聯, 實現對社會公眾用戶的精準化、個性化的知識推送服務。

4.2 基於知識融合的電子政務知識服務系統模型

基於電子政務的知識融合系統提供了一種將知識內容以更有效的形式關聯起來的方式, 將知識重組化或有序化, 去掉毫無價值或冗餘的信息或內容, 幫助政府用戶從大量繁瑣的海量知識中快速獲取解決問題的知識。該系統模型包含:本體庫、政務知識庫、元知識集、融合算法、解知識空間的生成、動態的反饋系統等方面 (如圖3所示) 。

系統框架分為四個主要功能模塊:公眾問題分析與分解、本體管理、知識融合和知識服務。用戶問題分析模塊主要面向公眾用戶的現實問題需求, 一切以用戶需要為中心, 以用戶為導向, 將對公眾用戶提出的具體問題運用大數據技術進一步精準化分解, 並採用數據挖掘技術進行數據分析, 然後由政務本體庫和映射目錄表來支撐其實現個性化知識服務的精準推送;本體管理模塊負責處理領域內本體之間的語義理解、語義關聯及知識交互關係, 並通過映射表來實現;知識融合模塊按照融合規則集中的條目內容和待解決問題對應的本體對象, 選擇與設計合適的融合算法語言與程序, 將分佈式異構數據源融合成新的集成化對象;電子政務知識服務模塊以用戶需求為導向, 在知識融合過程中引起的知識元素變化時, 對用戶服務端的相應知識元素進行同步更新。從而實現對社會公眾用戶的知識服務需求進行定向、精準和個性化推送。

模型丨基于知识融合的电子政务知识服务模式及系统模型

圖3 基於知識融合的電子政務知識服務系統模型

5、研究侷限與展望

目前, 學術界對知識融合的相關領域研究尚不夠深入, 尤其是將知識融合技術融入知識服務應用實踐中都亟待研究者深入探討和研究。本文在梳理國內外相關研究文獻的基礎上, 將知識融合的相關理念和技術融入到電子政務知識服務應用中, 提出了基於知識融合的電子政務知識服務模式, 並構建基於知識融合的電子政務知識服務系統模型, 一定程度上推進了電子政務知識服務理論研究向縱深發展。由於諸多原因, 本文在研究過程中尚存在諸多研究侷限與不足之處, 一方面, 知識融合是面向知識服務和決策的問題, 是以多源異構數據為基礎, 在本體庫和規則庫的支持下來實現的, 但現實中公眾用戶所處的數據環境越來越複雜, 且很多數據是動態化、且是連續生成的 (如傳感器數據和其他數據流) , 如何從動態化、連續生成的數據中探索和發現元數據和元知識?另一方面, 大數據環境下的數據基礎比較複雜, 如何構建知識模型和知識表示, 以便使知識融合系統能夠更加容易理解、處理和應用海量的政務知識, 從而更好地提供一種面向公眾用戶的提供決策和解決方案的電子政務知識服務。

參考文獻:略


分享到:


相關文章: