什么是大数据,大数据的定义又是什么?

生活问题百科知识


大数据

又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯

简而言之,大数据就是数据量非常大、数据种类繁多、无法用常规归类方法应用计算的数据集成。大数据的收集、开发和利用,已经成为了当今社会的潮流之一,人们都认为,对于大数据的分析应用,对于政府和企业的决策是非常积极的,影响也是非常深远的。

大数据的采集、发掘与处理

大数据的采集与发掘与云计算是离不开的,与庞大的服务器空间也是分不开的。而现在的倾向就是租用云计算平台进行大数据的整理运用,简单快捷,还不占地方。

大数据的应用

一切皆可以大数据。

将人们所收集的各种数据分类汇总,最终通过高精尖的平台运算,分析其中的规律所在,就是大数据的应用。如果数据收集得当,任何行业、任何事情都可以运用大数据寻找规律,最终做出最优的小抉择。无论从公司营销、政府决策、高速公路运营、农场管理、来年预算等等,大大小小的事情都可以应用大数据,并且从中获利。

大数据的前景

大数据的前景并不仅仅是某一个行业的前景,一句话以盖之——大数据时代已经来临,并将从根本影响人类的生活。


镁客网


我本身是做大数据行业的,根据我个人的经验,通俗的,简单的总结以下几点吧

  1. 大数据,这个概念来说的话,我认为就是一套工具,一套过程,或者说一套方法论。

  2. 大数据,顾名思义就是数据量要大,这是前提,要有数据积累,要有数据沉淀,而且数据维度越多越好,数据深度越细越好,因为只有数据越深越细,才能释放更多的价值。

  3. 大数据,概念很大,很先进,不可否认,目前在行业内,有很多公司或个人打着大数据的幌子做着伪大数据的事情。

  4. 大数据,简单、通俗地讲,就是整合各种各样的数据,利用数据,沟通数据建模,或数据加工,或数据二次评价,让数据换发新的活力,在海量数据中挖掘出数据隐藏的、未被开发的价值,将数据应用到生产生活中,我个人认为可以将大数据分为政府大数据,和社会大数据。

  5. 政府大数据,就是说存储在当前各级政府内部的数据,中国百分之80的,有高价值的数据基本都是在政府内部,尽管目前国家在鼓励大数据产业发展,提倡阳光政府,提倡数据开放共享,但各级部门目前都将数据看做是权力的象征,各级部门之间,部门内各科室之间的数据孤岛现象非常严重,突破难度很大,在没有国家更高一级的层面上支持的话,彻底打造阳光政府是很难做到的。

  6. 社会大数据,就是说大数据应用在民用,商用,这部分目前在中国发展的如火如荼,腾讯、阿里巴巴、滴滴、今日头条、百度等巨头都应用得非常非常好,举个最简单的例子:百度地图导航,正是基于在海量的交通数据、地理位置数据、卫星数据、实施道路数据的前提下,对数据进行整合融合,通过对数据建模,研发出导航应用,每一次导航的体验,都是大数据深刻应用的最好体现。

  7. 大数据,从抽象宏观上,可整体分为数据采集、数据清洗、数据过滤、数据转换、数据重载(统称数据ETL),数据处理、数据管理、数据资源目录、数据共享、数据开放、数据交换、数据应用等。


就爱玩数码


大数据是一个术语,它描述了大量的数据 - 无论是结构化的还是非结构化的。可以通过分析大数据以获得更好的决策和战略业务动向。

当前的普遍共识是,大数据具有几个属性来标识。在大多数大数据圈中,常常用4V:数量(VOLUME),种类(VARIETY),速度(VELOCITY)和准确性(VERACITY)作为大数据的属性,这一说法最早是由IBM的数据科学家提出的。近年来,第五个V- 价值(VALUE)也被提出作为新加的一个属性。


数据量(VOLUME) - 描绘了数据的规模

使数据“大”的主要特征之一数量。信息总量每年在呈指数增长。在2010年,汤森路透在其年度报告中估计,它相信世界“EB级别 的数据在不断增长。”(1EB=1024PB;1PB=1024TB; 1TB=1024GB; 5 Exabyte相当於至今全世界人类所讲过的话语)


数据种类(VARIETY)- 描绘数据的多样性

数据种类和来源越来越多样化,包括各种结构化的数据、非结构化的数据、半结构化的数据。来源从传统的关系型数据库中的表格数据,扩展为文本数据、网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。


准确性 (VERACITY)- 描绘数据的可信度

准确性是指数据的质量,可以信赖的程度。收集、分析的数据能否代表真实业务情况?每位优秀的管理者都知道,收集到的所有数据都存在固有的差异。


速度(VELOCITY) - 描绘数据变化的频率

速度表现为数据增长速度快,处理速度要求也快,时效性要求更高。目前,大数据的交换和传播是通过互联网、云计算等方式实现的,远比传统信息传播速度快的多, 因此,对处理数据的响应速度有更严格的要求。许多业务都需要实时或者近实时的分析能力!


价值(VALUE) - 描绘数据的意义

现实世界中的数据中,有价值的数据所占比例很小,至少容易挖掘出的有价值的数据比例很小。任何大数据项目的最终目标应该是为公司进行所有分析创造某种价值。否则,你只是为了技术而完成一些技术任务。


【关注ABC(A:人工智能;B:BigData; C: CloudComputing)技术的攻城狮,Age:10+】


乐之天空


大数据

大数据是指收集了海量的各种信息的集合,计算机上是指用单台计算机软硬件设施难以采集、存储、管理、分析和使用的超大规模的数据集。大数据具有规模大、种类杂、快速化、价值密度低等特点。大数据的“大”是一个相对概念,没有具体标准,如果一定要给一个标准,

那么10-100TB通常称为大数据的门槛。

大数数据的作用

什么时候需要大数据,我们可以从下面这几个方面去了解,方便你深入了解大数据。

  • 数据分析


通过自身的产品为目标用户群提供支持或服务,而用户在使用产品或服务过程中产生的交互、交易,都可以作为数据采集下来。收集这些数据,通过分析的手段反推客户的需求,创造更多符合需求的增值产品和服务,重新投入用户的使用,从而形成形成一个完整的业务闭环。这样的完整业务逻辑,可以真正意义上驱动业务的增长。

  • 商业决策

大数据最有意义的方向是商业决策,通过数据来判断应该做什么。而商业数据分析的目的,就是商业结果。当数据分析的产出可以直接转化为决策,或直接利用数据做出决策,那么这才能直接体现出数据分析的价值。

-----------------------------------

本人现处广州从事互联网工作多年,资深技术人员、管理人员。愿结识有互联网业务的技术人员或企业人员、或有想法的创业人员


程序员的一些事




但什么是大数据呢?大数据是指在一定时间内用软件工具对其内容进行抓取、管理和处理的数据集合。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。



通俗一点说就是我们在互联网的各种行为被我们使用的APP或其它软件记录下来,并加以分析整理,甚至很多时候会和我们的真实身份联系到一起。这就是大数据,“便利”了我们,也让我们更加透明!



大数据的定义:“大数据是使用新型的信息处理方式对大量的信息进行高速及时的整理分析去促成更强的决策能力、洞察力与最优化处理。”



明白的糊涂先生


大数据,按目前通俗意义上来讲,就是各互联网企业通过自己的应用APP所记录的受众人群的信息汇总总和。主要的目的是通过后期数据分析与发掘来确定企业的不足和发展方向。通过深入分析数据以推出最适宜的产品,以最少的成本获得最大的利益。



其实吧,个人觉得这只是狭义上的理解,真正的大数据应当是人类文明发展至今的文明产出总和,这是一个庞大的工程,非一人之力也非一朝一夕仓促可成,不过历史的发展似乎给了今人以时机和能力。

古代帝王在自己条件有限的情况下尚可清有《四库全书》,明有《永乐大典》。再往前推,各类数据浩如烟海,不再赘述。横向看世界更是名目繁多,璨若星河。



为什么要有大数据,不仅仅在于记录过往的辉煌,更多寄希望于通过通鉴历史,规范前行。大数据的应用,不应当是企业的,保守的,小范围局部的,应当是普惠全人类的。不要是“墙外行人,墙里佳人笑”。



外行之言,大家莫笑。


不是英雄莫流连


大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。 大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。


互联网少侠


中文名:大数据

英文名:big data

别 称:巨量资料

提出者:维克托·迈尔-舍恩伯格

特点:大量、高速、多样、价值

应用学科:计算机



有人把数据比喻为蕴

藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,

大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是成为赢得竞争的关键。



2015年9月18日贵州省启动我国首个大数据综合试验区的建设工作,力争通过3至5年的努力,将贵州大数据综合试验区建设成为全国数据汇聚应用新高地、综合治理示范区、产业发展聚集区、创业创新首选地、政策创新先行区。


一生一世_798


大数据分析对我们的生产生活带来很多便利,同时制约者我们更好的贴近生活,遵循自然法则。


分享到:


相關文章: