啤酒和尿布的故事
在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘。一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了一个隐藏在"尿布与啤酒"背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。
沃尔玛从数据当中挖掘出了宝贵的“啤酒和尿布”的知识,那么如何区分数据、信息以及知识,达文波特认为知识既不等于数据,也不等于信息,它们是无法互换的概念,但这三者息息相关。彼得.德鲁克曾说“信息是包括关联性与目标的数据”,这说明数据本身并不具有关联性和目的。简单地说,知识不是数据的简单累积,也不同于信息,信息只是知识的原料。某种程度上,信息和知识的区别有点象字典和语言,如何利用信息获得知识,很大程度上是一种创造性的艺术。
1998年,世界银行推出了《1998年世界发展报告一一知识促进发展》对数据、信息和知识之间的区别进行了阐述,报告指出:数据是未经组织的数字、词语、声音、图像等;信息是以有意义的形式加以排列和处理的数据(有意义的数据);知识是用于生产的信息(有意义的信息),信息经过加工处理、应用于生产,才能转变成知识。
微软曾经这样理解数据、信息和知识之间的关系和区别,它认为:
“数据”的一般特征是关于事件和关于世界的一组独立的事实,围绕着数据建立活动,其核心价值在于分析、合成,并把这些数据转化成信息和知识。“信息”是捕捉了来龙去脉的内容并加以经验和想法后的产出物,它是以半结构化的内容存储的,像文件资料、电子邮件、声音邮件以及多媒体等,围绕信息建立活动,其核心价值在于管理内容的方法,这种方法要易于找到内容,反复使用它们,并方便从经验中学习,这样就不会重复错误,工作也不会被复制。“知识”是由个人的隐式经验、想法、洞察力、价值、以及判断等组成的,它是动态的,需要通过与有知识的专家直接合作与交流才能拿得到。又有研究者在更高程度上解释了信息、知识以及智慧这三个不同的概念,认为信息是过去知识的编码,是静态的概念;知识是认识世界的显性和隐性知识的总和,是一种产品又是一个过程;智慧是把知识应用于活动并产生新的知识的一个动态过程,即创新能力,一个真正的知识型企业不仅需要组织的知识,更需要组织的智慧。
数据、信息、分析、知识和智慧
在一个组织的信息系统和数据库里蕴藏着巨大的机会,组织可以利用特定技术对数据和信息进行挖掘,使组织从由其形成的竞争优势中获益。这种从数据中挖掘竞争优势的做法实际上就是一种由数据到知识及智慧的过程,分为数据、信息、分析、知识以及智慧这五个层次:
数据,由于数据库管理系统以及数据存储技术的产生和发展,很多企业和组织中都已收集、处理、存储了大量的有关人、交易、事件等类型的数据,这些数据和组织的业务过程息息相关。例如,一个杂货店收集和存储了有关顾客购物的交易数据,包括如下的数据元素:货物名称、数量、价格、日期等。交易处理系统存储了大量的相关数据,为更高层次的理解奠定了基础。数据
信息
分析
从知识到智慧
在实际应用中,对应于上述的五个理解层次,分别有相应的技术对不同层次提供支持。目前很多企业都具有了一定的分析数据的能力,但是只有那些能够充分从数据里发现“金子”—知识、并进而上升为智慧的企业才能够获得真正的竞争优势。另外,我们决不能忽视人类思维的作用,当人工智能企图模仿人类的思维过程时,事实上还一直都没有研究出真正可以代替人类思维的技术,人机智能共生将是未来工作的常态。
五个层次对应的技术支撑
知识图谱支撑大数据到大知识
由此,可以这样给出数据、信息、知识以及智慧之间的辨证关系。数据、信息及知识是处于一个平面上的三元关系,分别从语法、语义以及效用三个层面反映了人们认知的深化过程,即信息是基于数据进行上下文解释和分析得到的有规律的数据,知识则是在信息基础上进行行为解释而得到的有价值的信息。目前有很多计算机辅助工具可以帮助人们完成从从语法、语义以及效用的认知过程。而智慧则超越了这个平面,它是人们在数据、信息以及知识基础之上的独创性活动,并主要以已有的知识存量为基础,可以说是一种更高层次的知识创造过程。