模型丨基于知识融合的电子政务知识服务模式及系统模型

摘要:针对当前政府大数据存在多源化、异构化、碎片化及价值密度低等问题, 给电子政务知识服务带来巨大挑战。知识融合能解决多源、异构的知识优化重组问题, 提高电子政务知识服务质量。首先, 对知识融合及其相关研究进展进行了理论回顾, 探讨了大数据环境下电子政务知识服务的内涵、基本特征, 分析电子政务知识服务对知识融合的现实需求;其次, 提出了基于知识融合的电子政务知识服务模式, 构建了基于知识融合的电子政务知识服务系统模型, 并对系统模型进行分析;最后, 总结了研究局限与展望。

引言

大数据存在体量大、多源化、异构化、碎片化、价值密度低等特点, 在一定程度上提升了电子政务知识服务的效率和质量, 丰富了电子政务知识服务的内涵和手段, 同时, 也给电子政务知识服务带来了新的挑战。大数据环境下, 如何提高电子政务知识服务质量, 从而为政府决策者提供精准的、个性化知识服务解决方案, 成为电子政务知识服务研究领域的热点和难点。

知识融合通过满足用户个性化的知识需求来提高知识服务质量, 促进知识共享、知识交互和业务协同, 实现知识创新, 可帮助管理决策者找寻组织内外部知识间的潜在的、隐形的某种关联, 发现被忽略的因素, 从而为决策者提供精准化、个性化知识服务和解决方案, 是大数据环境下进行知识获取、组织和利用的有效途径。

1、理论综述与研究进展

1.1 知识融合及其研究进展

知识融合 (Knowledge Fusion) 最早于20世纪90年代初被提出, 是在知识聚合、信息融合、数据集成等研究的基础上提出的新概念。著名情报学者邱均平等人认为, 根据知识来源的不同, 将知识融合研究划分为两类:其一, 知识融合是信息融合发展的高级阶段, 是信息融合衍生而来, 主要指从物理层获得的数据转化而来的信息, 军事、医学、工程学科学者是其主要研究力量;其二, 知识融合是知识管理视角下的知识融合, 主要是从知识库、网络文本数据库中抽取而来的知识, 管理科学、图书情报学、计算机科学等学者是其主要研究力量。国外研究方面, 可以发现国外学者对知识融合进行了大量的研究, 从工程学科、计算机科学等学科视角研究知识融合仍然占据主导地位, 从图书馆信息科学 (LIS) 学科视角研究知识融合在近年逐渐兴起, 知识融合主题引起了图书馆信息学界的极大关注。从知识融合研究内容分析, 涵盖了算法研究、系统研究、框架研究、应用研究和实证研究。理论研究包括基于语义理解的知识融合、基于贝叶斯网络的知识融合等研究领域;应用研究则覆盖面向网格环境的知识融合、面向企业知识的知识融合等方面。国内方面, 国内学者研究知识融合问题, 多偏重于应用层, 强调辅助决策支持、提升知识服务质量。从研究主体看, 计算机科学等学科背景的学者仍占主流, 图书情报学领域的研究者相对较少, 关注领域集中于参考咨询、协同标注及大数据、关联数据环境下的知识融合。如唐晓波等人探讨了大数据环境下的知识融合框架模型, 高劲松等人提出了基于关联数据的知识融合模型, 沈旺等人提出数字参考咨询知识融合框架, 该框架有利于解决异构数据的结构异构性、语义矛盾性等问题。

1.2 电子政务知识服务内涵及研究进展

电子政务知识服务, 是以政务信息知识的识别、获取、组织、存储、挖掘的能力为基础, 根据用户的问题描述和所处环境, 融入用户解决问题的过程之中, 提供能够有效支持政务知识应用和知识创新的服务。大数据环境下知识总量的增加, 公众用户关注的不仅仅是政务信息的搜寻、获取, 更多地关注如何利用知识解决问题, 如何获取能解决问题或提供个性化解决方案的的知识。电子政务知识服务要求对分布式的、异构多源的政府数据资源进行集成和整合, 通过建立数字化知识服务平台, 建设业务应用系统, 构建电子政务知识服务体系, 对内满足政府管理和政府决策需求, 对外满足公众对信息、知识和服务的需求, 实现知识应用和知识创新, 最终提高政府的管理决策效率和服务能力。与其他类型知识服务不同的是, 电子政务知识服务具有很强的公共性, 其最终目的在于提高政府行政的效率和能力, 辅助政府决策, 提高公共服务的质量。

近年来, 国内学者对电子政务知识服务领域的相关研究, 聚焦于服务模式和技术实现等领域。研究内容主要涉及基于网格的电子政务知识服务、基于用户兴趣聚类的电子政务知识服务、基于门户网站的电子政务知识服务等方面。如柳巧玲提出了一种基于知识网格技术的电子政务知识服务平台, 伍革新等人设计了基于用户兴趣聚类的电子政务知识服务平台模型, 并开展了具体实证分析, 徐晨琛提出了基于门户网站的电子政务知识服务模式, 并构建了电子政务知识服务平台, 马海群等人提出支撑知识产权电子政务的知识服务。

在关键技术实现方面, 国内学者逐渐聚焦电子政务知识服务的技术实现、平台搭建等研究领域。研究主题主要集中在本体、语义Web、主题图、知识网格等相关技术层面探索在电子政务知识服务中的引用, 以及搭建电子政务知识服务系统平台、构建知识服务框架体系等方面, 取得了一定的研究成果。知识融合能提高电子政务知识服务的效率和质量, 但就大数据环境下基于知识融合的电子政务知识服务模式、系统模型以及技术实现等领域的相关研究甚少涉及, 亦缺乏相关代表性研究成果。

2、大数据环境下的电子政务知识服务

2.1 大数据知识服务与传统知识服务

大数据环境下, 数据总量及数据库数量呈指数级增长, 知识爆炸和数据泛滥成为大数据时代的显著特征。如何从海量的、纷繁复杂的数据中提取出能够面向用户服务和决策需要的知识、开发并挖掘出知识的巨大价值, 进而使这些知识能解决现实问题或提供问题解决方案, 从而科学、高效的利用这些知识, 开展高质量、高效率的知识服务, 成为摆在各知识服务机构面前亟待解决的难题。

传统知识服务过程中的关键问题在于用户的需求分析 (包括用户真正需要的是什么, 知识服务内容和服务方式是什么, 如何实现知识服务的自适应性和可扩展性) ;知识的提取和发现 (如何提高现有知识的价值并推导出更多的知识, 从而进行知识创新) ;知识的表示和建模 (如何构建知识模型和表示知识, 以便系统能够容易理解、处理和应用知识, 对于动态隐形的知识, 如何进行表达和转化) ;如何进行知识管理以便于用户进行检索和利用、如何突破知识共享的障碍、用什么样的技术解决方案以及如何实现知识共享平台等方面。

大数据知识服务与传统知识服务的区别在于, 大数据知识服务是用以解决结构化、半结构化和非结构化数据的知识服务新模式, 是面对海量的、动态的、异构的信息源, 提取有效的、未知的、最终可理解的知识, 特别强调用户参与, 将用户参与渗透到用户的精准需求及知识服务的全生命周期管理的每一个环节。一方面, 大数据知识服务共享的是服务资源, 知识、能力和服务过程;另一方面, 大数据知识服务, 不仅包括对移动状态数据的获取、存储、组织、利用等过程进行管理, 而是将计算、知识和服务推向数据, 在相应的知识库、专家库、数据处理模型及框架的支持下, 实现大数据获取、存储、组织、利用等过程中的知识、能力、资源和过程的全面共享和交易。大数据环境下的知识服务主要用以解决结构化、半结构化和非结构化数据的多维度数据处理需求, 更多强调知识、能力、资源和过程以服务的形式进行有机融合, 是嵌入式协作化知识服务模式的新发展。大数据环境下, 面对动态、海量、异构信息源, 如何提取有效的、未知的、最终可理解的知识成为知识服务的关键问题, 数据挖掘技术帮助用户发现了隐性知识, 实现了知识共享;而知识融合技术则帮助用户解决了分布式、异构、多源异构数据源的集成。

2.2 大数据下电子政务知识服务及其特征

大数据环境下的电子政务知识服务要求其对分布式的、异构的、碎片化、多源化的政府信息资源进行统一整理和深度整合, 实现由数据库向知识库的转变, 建立政务知识共享、交互和服务平台, 建立协同作业的业务应用系统, 构建电子政务知识服务平台, 为实现政务知识语义层面的检索提供依据, 为电子政务一站式、集成式服务打下基础。具体而言, 大数据环境下电子政务知识服务具有以下特点:

(1) 不确定性的知识服务。大数据下的电子政务知识服务对于公众用户的知识需求满足并不是提供唯一的解决方案, 而是一组解决方案集合。社会公众或企业用户通过电子政务知识服务平台提出个性化的知识服务需求, 政府利用大数据技术和方法, 依据社会公众用户大数据需求, 形成政务知识服务解集合, 并部署政务知识服务实施方案。大数据知识服务平台通过基于语义理解的知识服务匹配技术、知识融合算法技术、智能优化技术等, 从大数据知识服务解集合中, 选择合适的服务参与组合, 并优选和组合出最佳的一组解决方案来实现用户的知识服务请求。

(2) 精准化的知识服务。大数据为电子政务知识服务提供了丰富、海量的政府数据资源和专业的数据分析技术 (如Hadoop) 、全新的问题解决方案和思维方式, 从而使得电子政务知识服务成为一种面向社会公众用户需求和为用户提供个性化解决方案的服务, 更加注重个性化、精准化地向社会公众用户提供解决问题的知识、支持公众用户参与社会管理、科学决策过程或为其提供精准化的解决方案。

2.3 电子政务知识服务对知识融合的现实需求

知识融合通过对分布式数据库、知识库和数据仓库等信息源进行智能化处理, 对知识进行转化、集成和融合, 其本质就是多源异构的知识优化重组问题, 目的就是实现知识创新。知识融合的价值就在于从众多分散的、异构的数据源、知识源中挖掘出隐含在社会公众用户日常行为大数据中的有价值的、尚未被发现的信息和知识 (尤其是隐形知识, 如规则、方法、模型、技巧、经验等) , 利用关联数据和大数据分析等技术, 帮助政府决策者发现这些政务大数据之间潜在的某种关联, 发现被忽略的隐形因素, 从而为某一社会公共事务领域问题的求解提供精准化、个性化、专业化的政务知识服务或问题解决方案。具体而言, 电子政务知识服务对知识融合的需求体现在:

(1) 来源多源化及结构异构性。大数据环境下, 数据来源除了传统数据资源外, 还包含了更为丰富的新数据源, 如物联网感知数据、企业商务交易数据、社交网络数据、用户行为数据等。此外, 越来越多的非结构化数据、半结构化数据呈海量增长, 采用的技术和语义也不同, 大数据环境下, 越来越多的非结构化数据、半结构化数据呈海量增长, 并且这些数据的组成结构、格式类型、存在状态都愈加复杂, 这使得多源、异质、异构的数据的融合变得异常艰难, 数据类型的扩大化和数据结构的复杂化给数据处理带来巨大挑战。知识融合可以成为一种重要的操作和管理这些数据的有效工具, 知识融合通过融合数据资源, 建立数据平台, 对内满足政府管理和决策的需求, 对外满足公众用户对政务信息、知识的个性化、精准需求。

(2) 形式碎片化和价值稀疏性。大数据环境下的知识融合不仅仅是针对某个专业领域内的数据单元和知识单元, 而且还包括建立知识与数据之间关联关系 (特别是隐形关联) 。同时, 数据激增带来了大量不相关数据和低密度数据的存在, 给“知识”提纯带来难度。知识融合可实现分布式知识库中更多知识的交互, 利用融合算法技术和语义理解技术, 在知识单元间建立关联或语义关系, 并将知识重组或整序, 去掉重复或无用的内容, 帮助用户从大量繁杂的知识中快速获取解决问题的知识。通过知识融合来整合各级机构后台数据库的碎片化政务数据, 提高知识价值、进行相互联接、信息交换和服务的整合, 以便于更高质地为公众提供知识服务。

3、基于知识融合的电子政务知识服务模式

3.1 基于电子政务的知识融合流程

知识融合结合知识表示、知识发现等技术手段来实现对知识的语义进行深度加工, 为大数据环境下精准化电子政务知识服务提供技术支撑。知识融合通过对多源异构数据进行提取出有效的、未知的、最终可理解的知识, 一般应用于集成式信息检索领域, 包括分布式、异构、多媒体数据源的集成。知识融合面向用户需求和知识创新, 通过对众多分散、多源、异构政务知识资源和政务大数据的获取、采集、匹配、挖掘、集成、优化、分析等处理手段, 获取隐含的或有价值的新知识, 同时, 优化知识的结构和内涵, 实现知识共享、知识创新、知识交互, 提供知识服务, 应用的主要方法与技术是本体、主体图、语义网和关联数据等。

基于电子政务的知识融合流程是面向公共服务和管理决策问题的, 以多源异构的政务大数据为基础, 在政务本体库和融合规则库的支持下, 通过知识抽取和转换获取隐藏在政务大数据中的数据因子及其关联关系, 进而在语义理解层面上进行组合、推理、创造出新知识的过程, 并且这个过程根据数据源的变化和用户的反馈进行动态调整, 从而解决应对公众服务和管理决策中的政府知识需求问题, 构成基于知识融合的整个流程 (如图1所示) 。

模型丨基于知识融合的电子政务知识服务模式及系统模型

图1 基于电子政务的知识融合流程

图1中可以看出, 面向服务和决策的电子政务知识融合的任务开始于特定的用户需求 (社会公众的多样化知识需求) 和应用问题, 最终的产出是能够满足用户需求和解决实际应用问题的融合结果, 融合结果是从政务大数据中产生了新的政务知识, 或是产生了对解决特定问题有实际价值的政务知识。其中, 融合算法目标是通过某种可流程化实现的处理过程, 将已有的知识元素按照约定的规则进行比较、合并和协调等融合运算, 从而产生出新的可用知识对象内容并同时对原有知识元素进行优化。知识融合规则是实施知识融合算法的基础, 规则库的丰富性和准确性直接影响着融合的结果, 规则库中包含着适应不同条件的融合规则, 为后续过程提供知识库。

3.2 基于知识融合的电子政务知识服务模式

知识融合的价值就在于从大量多源、异构、动态、碎片化、不确定及价值稀疏的数据源、知识源中挖掘出隐含的、有价值的、尚未被发现的信息和知识。基于知识融合的电子政务知识服务更加注重向社会公众用户提供解决问题的知识服务, 支持政府用户进行科学决策参考或提供精准的问题解决方案, 不仅仅帮助用户获取数据、事实等显性知识, 同时也帮助用户获取具有创造性的隐形知识, 实现知识应用和知识创新, 在服务方式上, 更显主动化和个性化。

知识融合主要是将不同地点、不同应用平台的分布式数据库、知识库及数据仓库进行智能化转化、集成和融合, 形成虚拟数据库或云服务平台, 同时, 对不同业务部门的异构知识进行挖掘、整合、协同和集中, 构建电子政务知识库。其中, 业务应用融合主要是分散的、异构的业务应用系统进行集成、交互、共享;服务融合主要以知识融合为基础、以业务应用融合为平台, 向用户提供一站式、面向用户需求和问题解决方案的知识服务。知识融合通过对分布式数据源和知识源进行组织和管理, 结合应用需求对知识元素进行转化、集成及融合处理, 从而获取有价值或可用的新知识, 通过融合算法构建元知识集、本体知识库及专题应用知识库等, 实现政务知识的融合, 提供基于知识的服务。

以知识融合为基础构建的电子政务知识服务平台是一个大数据采集、组织、存储、分析和面向决策及用户需求的智慧化平台, 是在政府信息资源整合和共享平台构建的基础上, 是以知识集成为基础, 以应用的集成为平台, 通过数据挖掘、机器学习、知识发现、知识表示等相关技术, 促进“信息”向“知识”转化, 促进显性知识和隐性知识的转化, 实现对知识的获取、加工和开发利用, 并以电子政务知识服务平台为载体, 向公众用户提供协同式、面向决策支持和问题解决方案的知识服务。这种服务模式是为适应电子政务知识服务智慧化、协同化、泛在化而衍生的一种基于Web的用于解决结构化、半结构化和非结构化数据多维处理的电子政务知识服务模式 (如图2所示) 。

模型丨基于知识融合的电子政务知识服务模式及系统模型

图2 基于知识融合的电子政务知识服务模式

图2中, 知识融合和知识共享、知识集成之间有部分重叠内容。这是因为, 知识融合是与知识共享、知识集成等技术的共同点都是在知识层面进行处理, 都要对知识进行组织, 目的都是对政务知识库进行优化和重用, 提高电子政务知识服务的效率和质量。区别在于知识融合是通过合适的算法模型产生基于现有知识为基础的知识创新, 形成新的可利用的、有价值的新知识, 并且能够应用反馈对新的知识进行合理评估, 从而提高电子政务协同工作的能力, 这是知识共享和知识集成所无法实现的。

知识融合通过对分布式政务数据库、政务知识库和数据仓库等信息源进行智能化处理, 采用转换、集成、提取与合并等方法, 建立统一的知识表示模式并对显形和隐性知识进行相互转化、集成及融合, 实现知识创新, 以获得有价值或可用的新知识, 这样不同的电子政务系统之间可以实现知识的共享和业务的协同, 能够对知识进行更好的组织和优化、提供适合的共享模式, 实现对电子政务知识库本身的进一步知识挖掘, 从而产生出无法在数据层面挖掘到的新知识, 当知识库构建完成之后, 可实现基于知识的各种应用服务。

4、基于知识融合的电子政务知识服务系统模型

4.1 平台架构

电子政务知识门户是实现电子政务知识服务的载体和平台, 是数据集成、知识集成、应用集成和服务集成的统一。整个平台系统架构可分为四个部分:基础设施层、数据资源层、知识融合层、知识服务层。

基础设施层为中间层或者用户提供必要的硬件资源组成、所需的计算和存储资源, 包括通讯系统、计算机系统和服务器等。

数据资源层主要负责数据和知识的集成。数据集成通过统一的标准, 将位于不同地点、不同服务器和不同应用平台的各种异构数据在逻辑上或物理上进行集成, 以实现不同数据源的共享、交换、分析和呈现。知识集成就是将分散在不同的政府业务部门、不同地区的、异构的政府数据资源或知识进行业务协同和数据集成 (包括显性知识和隐形知识的集成) 。同时, 采用云计算技术、虚拟化技术将“政务云”资源池化, 包括大量的政务数据、信息, 以此构建政务知识库, 政务知识库是储存政务领域内的、可机读格式表达的特定领域的抽象或特定知识的集合, 它是知识系统的知识模块。政务知识库有利于实现政务隐形知识向显性知识的转化和集成。政务知识库要以公众用户的需求为导向来构建, 包括政务知识的识别与采集、知识的标识与序化、知识的加工与存储、知识库的维护和更新等步骤。政务知识库以描述的方式来存储和管理政务知识, 所有的知识都存储在逻辑上统一知识库中, 政务知识库和本体库的构建是知识融合的基石, 也是构成知识服务平台的关键。

知识融合层负责将电子政务系统中多源的、异构的各类政务大数据 (包括结构化政务数据和非结构化政务数据) 进行转化、匹配、集成和挖掘等, 从而实现知识融合。知识融合把孤立、分散的知识进行联系起来, 把分散、多源的知识进行集中化, 使混乱、无序的知识进行有序化, 使隐形知识显性化、关联化, 运用关联数据技术, 从而在政务数据资源和社会公众用户之间建立有效的联系, 缓解政务大数据无限性与公众用户需求无法满足之间矛盾。具体包括政务大数据获取与知识表示 (通过政务大数据获取、知识状态空间的表示来构建知识库) 、元知识集与统一知识模式构建 (解决数据体量大、异构的问题) 、知识融合算法的选择、衍生知识处理 (包括语义分析技术实现语义匹配产生衍生知识库) 等阶段。

其中, 知识融合算法的设计与实现是实现多源知识融合的关键环节, 按照融合规则将分散异构的知识源融合成新的集成化知识对象, 构建解知识空间、向社会公众用户提供个性化、精准化知识服务。对于衍生知识库中的知识, 通过机器学习、知识发现和知识融合算法等技术, 形成新的知识和融合规则, 构成动态的、反馈的知识融合系统, 实现知识的循环使用。同时, 根据公众用户需求与解知识空间进行匹配, 精准获取公众用户所需的知识, 通过用户接口反馈给用户, 从而实现基于知识融合的政务知识服务, 通过机器学习进行衍生知识处理是提高知识融合性能的必要手段。

知识服务层主要实现政务知识的智能搜索、政务知识的推送等个性化服务, 通过智能搜索和过滤技术, 主动发现公众用户的知识需求和政务数据资源, 过滤冗余知识。同时, 运用知识空间中衍生知识库之间隐含的语义关系, 进行知识推理, 挖掘公众用户的隐形知识需求及知识之间的潜在的语义关联, 实现对社会公众用户的精准化、个性化的知识推送服务。

4.2 基于知识融合的电子政务知识服务系统模型

基于电子政务的知识融合系统提供了一种将知识内容以更有效的形式关联起来的方式, 将知识重组化或有序化, 去掉毫无价值或冗余的信息或内容, 帮助政府用户从大量繁琐的海量知识中快速获取解决问题的知识。该系统模型包含:本体库、政务知识库、元知识集、融合算法、解知识空间的生成、动态的反馈系统等方面 (如图3所示) 。

系统框架分为四个主要功能模块:公众问题分析与分解、本体管理、知识融合和知识服务。用户问题分析模块主要面向公众用户的现实问题需求, 一切以用户需要为中心, 以用户为导向, 将对公众用户提出的具体问题运用大数据技术进一步精准化分解, 并采用数据挖掘技术进行数据分析, 然后由政务本体库和映射目录表来支撑其实现个性化知识服务的精准推送;本体管理模块负责处理领域内本体之间的语义理解、语义关联及知识交互关系, 并通过映射表来实现;知识融合模块按照融合规则集中的条目内容和待解决问题对应的本体对象, 选择与设计合适的融合算法语言与程序, 将分布式异构数据源融合成新的集成化对象;电子政务知识服务模块以用户需求为导向, 在知识融合过程中引起的知识元素变化时, 对用户服务端的相应知识元素进行同步更新。从而实现对社会公众用户的知识服务需求进行定向、精准和个性化推送。

模型丨基于知识融合的电子政务知识服务模式及系统模型

图3 基于知识融合的电子政务知识服务系统模型

5、研究局限与展望

目前, 学术界对知识融合的相关领域研究尚不够深入, 尤其是将知识融合技术融入知识服务应用实践中都亟待研究者深入探讨和研究。本文在梳理国内外相关研究文献的基础上, 将知识融合的相关理念和技术融入到电子政务知识服务应用中, 提出了基于知识融合的电子政务知识服务模式, 并构建基于知识融合的电子政务知识服务系统模型, 一定程度上推进了电子政务知识服务理论研究向纵深发展。由于诸多原因, 本文在研究过程中尚存在诸多研究局限与不足之处, 一方面, 知识融合是面向知识服务和决策的问题, 是以多源异构数据为基础, 在本体库和规则库的支持下来实现的, 但现实中公众用户所处的数据环境越来越复杂, 且很多数据是动态化、且是连续生成的 (如传感器数据和其他数据流) , 如何从动态化、连续生成的数据中探索和发现元数据和元知识?另一方面, 大数据环境下的数据基础比较复杂, 如何构建知识模型和知识表示, 以便使知识融合系统能够更加容易理解、处理和应用海量的政务知识, 从而更好地提供一种面向公众用户的提供决策和解决方案的电子政务知识服务。

参考文献:略


分享到:


相關文章: