数据、信息、知识和智慧——啤酒和尿布的内幕故事


数据、信息、知识和智慧——啤酒和尿布的内幕故事

啤酒和尿布的故事

在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘。一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了一个隐藏在"尿布与啤酒"背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。   

沃尔玛从数据当中挖掘出了宝贵的“啤酒和尿布”的知识,那么如何区分数据、信息以及知识,达文波特认为知识既不等于数据,也不等于信息,它们是无法互换的概念,但这三者息息相关。彼得.德鲁克曾说“信息是包括关联性与目标的数据”,这说明数据本身并不具有关联性和目的。简单地说,知识不是数据的简单累积,也不同于信息,信息只是知识的原料。某种程度上,信息和知识的区别有点象字典和语言,如何利用信息获得知识,很大程度上是一种创造性的艺术。

1998年,世界银行推出了《1998年世界发展报告一一知识促进发展》对数据、信息和知识之间的区别进行了阐述,报告指出:数据是未经组织的数字、词语、声音、图像等;信息是以有意义的形式加以排列和处理的数据(有意义的数据);知识是用于生产的信息(有意义的信息),信息经过加工处理、应用于生产,才能转变成知识。

微软曾经这样理解数据、信息和知识之间的关系和区别,它认为:

  • “数据”的一般特征是关于事件和关于世界的一组独立的事实,围绕着数据建立活动,其核心价值在于分析、合成,并把这些数据转化成信息和知识。
  • “信息”是捕捉了来龙去脉的内容并加以经验和想法后的产出物,它是以半结构化的内容存储的,像文件资料、电子邮件、声音邮件以及多媒体等,围绕信息建立活动,其核心价值在于管理内容的方法,这种方法要易于找到内容,反复使用它们,并方便从经验中学习,这样就不会重复错误,工作也不会被复制。
  • “知识”是由个人的隐式经验、想法、洞察力、价值、以及判断等组成的,它是动态的,需要通过与有知识的专家直接合作与交流才能拿得到。

又有研究者在更高程度上解释了信息、知识以及智慧这三个不同的概念,认为信息是过去知识的编码,是静态的概念;知识是认识世界的显性和隐性知识的总和,是一种产品又是一个过程;智慧是把知识应用于活动并产生新的知识的一个动态过程,即创新能力,一个真正的知识型企业不仅需要组织的知识,更需要组织的智慧。

数据、信息、知识和智慧——啤酒和尿布的内幕故事

数据、信息、分析、知识和智慧

在一个组织的信息系统和数据库里蕴藏着巨大的机会,组织可以利用特定技术对数据和信息进行挖掘,使组织从由其形成的竞争优势中获益。这种从数据中挖掘竞争优势的做法实际上就是一种由数据到知识及智慧的过程,分为数据、信息、分析、知识以及智慧这五个层次:

  • 数据,由于数据库管理系统以及数据存储技术的产生和发展,很多企业和组织中都已收集、处理、存储了大量的有关人、交易、事件等类型的数据,这些数据和组织的业务过程息息相关。例如,一个杂货店收集和存储了有关顾客购物的交易数据,包括如下的数据元素:货物名称、数量、价格、日期等。交易处理系统存储了大量的相关数据,为更高层次的理解奠定了基础。
数据、信息、知识和智慧——啤酒和尿布的内幕故事

数据

  • 信息,在交易数据不断得以处理和收集的同时,该杂货店实际上在收集着潜在的数据财富。交易数据中的每个数据元素个体并不能够提供任何有价值的意义,但是数据元素都处于一定的上下文结构中,它们在这种结构中就提供了信息,报表系统具有从数据库中提取和转化数据为信息的功能。例如,不同货物名称、数量和价格就提供了被购货物的信息,包括货物种类、数量和价格等。通过计算每种货物的销售额,就可以进行货物销售额排序。
数据、信息、知识和智慧——啤酒和尿布的内幕故事

信息

  • 分析,将不同的数据元素积聚形成信息是很有用的,同时,将数据分离和重新组织将能够提升信息的价值,这就是进行信息分析的意义。经营分析系统就具有类似的信息分析功能,它能够从信息中发现关联、模式、趋势、例外等更有价值的信息。例如,可以对杂货店中存储的信息按照特定的时间周期进行分析,可以得到有价值的分析结果,尿布和啤酒的销售受到时间周期的影响,而谷物、面包和牛奶则保持稳定的销售态势。通过上述的信息分析,得到了这样的一种销售趋势和模式信息,这将给决策提供支持。
数据、信息、知识和智慧——啤酒和尿布的内幕故事

分析

  • 知识,知识不同于数据、信息及分析,它可以来源于数据、信息和分析的任一层次,同时也可以从现有知识中通过一定的逻辑推理而得到。BI应用具有数据挖掘能力,能够从数据中发现隐藏的趋势以及不寻常的模式。通过对杂货店的数据进行称为规则归纳的数据挖掘,可以得到如下一条结论:买尿布的顾客通常有一半时候也买啤酒。尿布和啤酒初看起来毫无关联,但是通过数据挖掘得到了这种隐含的模式,这就是知识。
  • 智慧,智慧可以说是基于知识基础上的一种判断、谋略或行动。通过对杂货店数据的挖掘分析,得到了一种隐含的顾客购买模式。通过这个知识,杂货店主就可以对数据集合进行调查分析,从而开发一系列的销售模式。在时期1、2、3,啤酒的销售除了遵循顾客购买模式—买尿布的顾客通常有一半时候也买啤酒—的销售量外,还有额外销售,但在时期4却没有额外销售。这样可以通过分析时期4相对于时期3的啤酒销售情况,制定特定的销售策略来提高时期4的啤酒销售量,同时也通过分析时期2的尿布和啤酒的购买情况,以发现是什么导致了额外啤酒销售的产生。这样,通过利用知识,对于数据的更高层次的理解就被创造出来了,形成了一种智慧并转化为了价值。
数据、信息、知识和智慧——啤酒和尿布的内幕故事

从知识到智慧

在实际应用中,对应于上述的五个理解层次,分别有相应的技术对不同层次提供支持。目前很多企业都具有了一定的分析数据的能力,但是只有那些能够充分从数据里发现“金子”—知识、并进而上升为智慧的企业才能够获得真正的竞争优势。另外,我们决不能忽视人类思维的作用,当人工智能企图模仿人类的思维过程时,事实上还一直都没有研究出真正可以代替人类思维的技术,人机智能共生将是未来工作的常态。

数据、信息、知识和智慧——啤酒和尿布的内幕故事

五个层次对应的技术支撑

数据、信息、知识和智慧——啤酒和尿布的内幕故事

知识图谱支撑大数据到大知识

由此,可以这样给出数据、信息、知识以及智慧之间的辨证关系。数据、信息及知识是处于一个平面上的三元关系,分别从语法、语义以及效用三个层面反映了人们认知的深化过程,即信息是基于数据进行上下文解释和分析得到的有规律的数据,知识则是在信息基础上进行行为解释而得到的有价值的信息。目前有很多计算机辅助工具可以帮助人们完成从从语法、语义以及效用的认知过程。而智慧则超越了这个平面,它是人们在数据、信息以及知识基础之上的独创性活动,并主要以已有的知识存量为基础,可以说是一种更高层次的知识创造过程。

数据、信息、知识和智慧——啤酒和尿布的内幕故事


分享到:


相關文章: