02.25 大数据是不是科学,为什么?


大数据当然不是科学,大数据只是一个量词,其数据本身,只是存在于自然界的一切物质在不同维度上的一个点的反映,通过对不同维度上点(数据)的积累,运用不同的科学方法,进行分析论证预测及关联性应用。


大风里的风


先说观点,大数据是科学。

这个问题其实挺难回答,因为涉及到两个比较难于理解的概念:“大数据”和“科学”。

科学是正确反映世界本质与规律的理论,不可证伪。

大数据理论被数据科学家维克托·迈尔-舍恩伯格2008年在《大数据时代》中提出。

大数据指是指无法用常规工具进行处理、需对所有数据进行分析处理的数据学科。

如果要系统的认知大数据,就必须从三个层面来着手来分析他,具体的大家可以找相关的书籍来看:

一、大数据理论

1、大数据特征:具有5V特点Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。

2、价值探讨

3、现在和未来

4、大数据隐私

二、大数据技术

1、云计算

2、分布式处理平台(Hadoop)

3、存储技术

4、感知技术

三、实践

1、互联网的大数据

2、政府的大数据

3、企业的大数据

4、个人的大数据

大数据的核心就是预测。大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。


打工男


大数据是不是科学,为什么?

回答这个问题前,我们先来看一下什么是大数据?

大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中,大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

再来看一下,什么是科学,科学的定义是什么?

科学 指正确反映世界本质与规律的理论,包括正确的概念、命题、原理与理论体系;其对象是客观本质与客观规律,内容是科学本质与科学规律,形式是语言,包括自然语言与数学等人工语言。科学和科学理论是同义语。真正的科学或科学理论不可证伪。根据科学反映对象的领域,科学目前分为自然科学、社会科学、思维科学、横断科学、纵深科学、哲学六个大类。

看了以上什么是科学和什么是大数据后,不难得出,大数据是科学的结论。为什么呢?

一·大数据是一个正确的概念;

二·大数据是正确反映世界本质与规律的理论。

以上两条在对科学的定义里面都包括了,所以说大数据是科学。


电脑参谋


大数据本身既不是科学,也不是技术,我个人认为,它反映的是网络时代的一种客观存在,各行各业的大数据,规模从TB到PB到EB到ZB,都是以三个数量级的阶梯迅速增长,是用传统工具难以认知的,具有更大挑战的数据。

大数据来源于人类的测量、记录和分析世界的渴望和无尽的追求。随着信息技术,尤其是传感器、通信、计算机和互联网技术的迅猛发展和广泛应用,人类获取数据的手段越来越多,速度大大加快、成本急剧降低,层次和尺度更为精细,揭示自然现象和社会现象更加深刻,人联网和物联网又使得人人物物都成为数据源,这样一来,大数据成为网络时代人类社会的重要资产。

数据量巨大,价值密度低,实时在线,多源异构,怎么办?举个例子吧!聚类,物以类聚,人以群分,这是人类几千年来认识世界和社会的基本能力,是从大数据中发现价值必须面对的一个普遍性、基础性问题,是认知科学作为学科的学科,要解决的首要问题。无论是政治、经济、文学、历史、社会、文化、还是数理、化工、医农、交通、地理、各行各业的大数据或宏观或微观的任何价值发现。


云和数据



2016年2月,教育部公布新增“数据科学与大数据技术”专业,北京大学、对外经济贸易大学、中南大学成为首批获批高校。次年,又有32所高校获批。此次248所高校获批“数据科学与大数据技术”专业,几乎是前两次获批高校的8倍。


“没有什么行业是没有数据的”


“我认为没有什么行业是没有数据的。”清华-伯克利深圳学院数据科学与信息技术专业一年级硕士生王宇杰说。


他在去年9月从一名工科本科生跨学科进入了大数据专业。


大数据专业正成为时下火热的高校新增专业。在4月28日举行的教育部新闻发布会上,教育部高等教育司副司长范海林介绍,2017年全国高校备案专业中,新增数据科学与大数据技术专业点250个,同比增加了近7倍。从中国人民大学、北京师范大学、厦门大学等知名大学,到一些地方院校均投入了这股热潮。



王宇杰大二时在一次展会上不经意接触到了一款大数据可视化软件Tableau,由此对大数据产生了浓厚的兴趣。通过Tableau,王宇杰感受到,数据分析这个行业的潜力无可限量。随着移动互联网大数据时代的到来,数据量正在不断增长。未来,更多人将学会分析数据,并将数据的洞察运用到工作和生活中的方方面面。数据分析会从小众走向主流,人人都可以成为数据分析师。接下来的大学时间里,他参加了一些数据科学家训练营,和一些商业机构组织的训练营,还在慕课网站上自修了国外大学的大数据课程。


他在2016年的Tableau可视化分析争霸赛北京赛区比赛中拿到了第一名。Tableau可视化分析争霸赛是全球可视化数据分析人士的年度饕餮盛宴,每年都会成千上万数据狂人参加这一比拼。这其中,既有来自各行各业的数据分析专家,也有像王宇杰这样的数据爱好者,而王宇杰是获奖选手中唯一一名大学生。通过这些活动,王宇杰结识了这个一不断壮大的数据分析社区,也让他对这个行业更加充满热情。



大四时,王宇杰得到了保研的机会,“国内开设大数据方向研究生专业的大学并不多,主要有清华大学、北京大学、复旦大学、北京航空航天大学等,这是当时比较知名的几个高校。”王宇杰说。


王宇杰得到了北大和清华的offer,权衡之后,他选择了清华-伯克利深圳学院,这是清华和伯克利合办的硕士研究生项目,不仅可以在清华拿到数据科学学位,还有机会到美国加州大学伯克利分校去进行为期9个月的学习,同时拿到相关学位。


“我是清华-伯克利深圳学院招收的第二届硕士生,也就是说,大数据专业其实是一个非常崭新的学科,在我申请的那一年,相对来说,大家对这个概念还不是特别了解,当然已经有一定数量的申请者,远超我们实际录取的人数,但并不是那么的火爆。”王宇杰说。



“到了我下面那届,就是招收第三届硕士生的时候,竞争就变得异常激烈,在短短一年时间里,这个专业成为了大家认可的非常有潜力的专业,大批的工程本科生,或者是数学、经济方面的学生开始申请我们这个方向,因此录取率直线下降。个人感觉在近几年内,竞争会变得越来越激烈。”他说。


清华-伯克利深圳学院的数据科学与信息技术研究中心设有6个实验室,分别为传感器与微系统实验室、纳米器件实验室、物联网与社会物理信息系统实验室、未来互联网研究实验室、大数据实验室、智能成像实验室。


“我想一般人会认为我们专业课的名称会比较高大上,像大数据分析、大数据基础等,的确会有这些,但从本质上来说,我认为我们学的课程跟数学、工程学这些基础学科没有太大区别,当然加入了一些新兴科技的课程,比如现在很火的深度学习、人工智能。”他告诉记者。



王宇杰进入了智能成像实验室,学习和科研课题是关于计算机视觉。“用一句话来概括,我们要做的是赋予计算机人的视觉能力。怎么理解呢?以后是一个有大量机器人存在的世界,而机器人要跟人类进行交互,做一些基本的工作,必须要有视觉能力,看得懂周围的环境,所以我们做的事情就是通过技术的方法让计算机拥有人的这种视觉能力。”他说。


热门专业:数据科学与大数据技术


3月21日,教育部公布了2017年度普通高等学校本科专业备案和审批结果。


在新增备案本科专业中,“数据科学与大数据技术”最为热门。根据统计,共有250所高校新增“数据科学与大数据技术”专业,其中包括中国人民大学、北京师范大学、厦门大学等19所教育部直属高校。河南省21所高校新增该专业,为最多的省份。河北、山东、安徽、广东、江苏等省也有较多高校成功获批。



2016年2月,教育部公布新增“数据科学与大数据技术”专业,北京大学、对外经济贸易大学、中南大学成为首批获批高校。次年,又有32所高校获批。此次248所高校获批“数据科学与大数据技术”专业,几乎是前两次获批高校的8倍。


该专业备受高校青睐与国家大力支持大数据产业发展及该产业人才奇缺相关。


国务院2015年8月曾印发《关于印发促进大数据发展行动纲要的通知》,明确鼓励高校设立数据科学和数据工程相关专业,重点培养专业化数据工程师等大数据专业人才。

根据教育部上述2017年度高校本科专业备案和审批结果,此次共有60所高校获批“机器人工程”专业。


“机器人工程”专业大热的背后,是人工智能行业的持续发展。



3月6日,南京大学官网正式发布新闻,经研究决定,南京大学正式成立人工智能学院。今年政府工作报告中四次提及“智能”,并特别指出要“加强新一代人工智能研发应用”、“发展智能产业”。


值得注意的是,从清华大学到地方高校,大数据专业成为普遍的时尚。“清华或者其他一般院校,在这个领域里对科研的贡献会有差异,但事实上,在如今的大环境之下,大家都想跟上时代潮流,所以我认为无论处于怎样的研究水平,敢于去跟上这个时代,就是挺好的一件事情。”王宇杰说。


“大数据是一个概念,它包含的范围非常广,不同的专业方向,对外显示的名称可能都是大数据分析、大数据工程与技术,但是整个产业其实非常庞大,从前到后拥有一个很大的产业链。”他说。



“我认为数据分析师这个称谓已经太过宽泛了,我觉得这个行业需要细分,未来会有专门做算法的工程师,专门做硬件实现的工程师,以及专门做理论推导的科研人员等。”他说。


搜课


大数据不仅是一种科学,更是一种对企业成长,行业发展有推动作用的核心技术,一个行业的发展数据,一个人群的消费数据,一个社区业主数据,一个学校的家长数据,学生数据,师资数据,都可以成为一个大数据机构的核心基础,以数据为核心,以用户为核心,验算出不同的服务体系,应用体系,行动方案,个性化方案,也将成为私域流量的核心应用。

总之大数据应用的掌握会让某个领域的发展变得得心应手,游刃有余,再加上互联网科技的运用,会成为一种核心竞争力的重要武器





零售新变革


大数据是科学,科学源自于生活。

所以说你在问这个问题的时候你其实想的是大数据是不是迷信?!

用我这个行外人的观点来讲,“大数据”这个词语就跟它书面上的意思一模一样。

大+数据=大数据。

一、“大”就不用解释了。宏观、多、只是一个量比词。

二、“数据”是什么呢?是各种观念、观点、习惯这些的一个数据化的体现。就比如说你身边使用安卓手机多还是苹果手机多。按照10个人算有6个人使用安卓,4个人使用苹果。 里面的数字就是数据的体现。只不过在科学里面的数据更加深奥,我们无法解读罢了。

那个这两个词语结合起来就是“大数据”。

所以说大数据其实就是在我们现有阶段将多种数据进行分析验算,得出结论的一个科学。

最后说一句,其实大数据很早就有,就是我们的图书馆。


Mr爱答不理君


谈到大数据,让我想起了华为任总有一段采访。提到大数据其实本质上是统计学,而国内在统计学及学科发展上面已经严重滞后,所以敦促加强各个基础科学的投入,进而再谈到了要用最优秀的人去教育出更优秀的人。

只不过大数据在这里只是变成了一种简称,当然大数据首先得数据量大,其次通过足够大量的数据,分析,归纳,总结出数据后面呈现出背后的规律,其本身并没有臆测。

所以我认为大数据是科学



刘晶Larry


大数据算不算科学,我觉得必须算。科学是指人类探索研究感悟宇宙万物变化规律的知识体系的总称。 科学是一个建立在可检验的解释和对客观事物的形式、组织等进行预测的有序的知识的系统。

而大数据恰恰就是根据以往的海量数据,分析研究感悟世界万物变化的规律,从而分析人或事物的发展规律,并且作出预测。

如天气预报,也是需要综合以往的天气情况,找出规律,分析往后几天的天气变化趋势。

科学不仅仅指发明创造,只要是能分析世界万物发展规律的方法,并为全人类所用,都可以叫科学。

个人观点,觉得正确请点大拇指


吕毕华


不是科学是统计学它用处是约束个体,在这种环境下人的自由性就大打折扣,带来的是个体创新能力的下降,科学发现从何谈起!


分享到:


相關文章: