想自学大数据,不知道从哪里学起,有什么书籍和学习路线推荐么?

用户8328945825930


作为一名IT从业者,同时也是一名教育工作者,我来回答一下这个问题。

首先,要自学大数据还是具有一定难度的,大数据不仅内容比较多,难度比较高,同时还需要学习者具有一定的场景支撑,比如数据中心等等,所以初学者自学大数据通常需要按照三个阶段来安排学习计划。

学习大数据的第一个阶段要根据自身的知识基础和发展方向来完成一些基础知识的学习,不论是从事大数据开发还是大数据分析,都需要具有一定的程序设计基础,初学者从Java和Python开始学起都是不错的选择。Java的前期学习难度要大一些,Python则要相对简单一些,而且目前Python语言在大数据领域的应用前景也比较广阔。

学习大数据的第二个阶段是掌握大数据平台的相关知识,大数据领域的诸多岗位任务都离不开大数据平台的支撑,所以学习大数据平台是学习大数据技术的重要环节。学习大数据平台可以从Hadoop和Spark开始学起,一方面这两个平台是开源平台,另一方面这两个平台的应用范围也比较广泛,相关的学习案例也比较多。

相对于编程语言来说,大数据平台的内容相对比较多,而且也具有一定的难度,往往还需要初学者具备一定的Linux操作系统知识,所以如果自身的计算机基础知识比较薄弱,那么也可以从Linux操作系统开始学起。

学习大数据的第三个阶段就是实践阶段,实践阶段最好能够在实习岗位上来完成,一方面实习岗位能够提供场景支撑,另一方面在实习岗位上也更容易与有经验的技术人员进行交流学习。

我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。

如果有互联网、大数据、人工智能等方面的问题,或者是考研方面的问题,都可以在评论区留言,或者私信我!


IT人刘俊明


大数据可以自学,有Java开发经验的童鞋可以挑战一下。大数据主要学习三个平台Hadoop、Spark、Storm。不过因为大数据技术体系庞大复杂,不同的就业方向使用的技术差异也比较大,加之作为比较新的技术网上的学习资源很少,自学难度大,零基础建议报班培训学习。

推荐书籍:

《Effective Java中文版》

《Big Data》

《Hadoop权威指南》

《Hive编程指南》

《Learning Spark》

《Spark机器学习:核心技术与实践》

自学大数据可以学习哪些内容?有哪些书籍推荐?

https://www.toutiao.com/i6724194937652380171/


加米谷大数据


大数据学习可以从最基础的java语言入手,然后去学习Linux&Hadoop生态体系,一些分布式的技术理念,再然后就是学习机器学习,深度学习算法。

阶段一、大数据基础——java语言基础方面

(1)Java语言基础

Java开发介绍、熟悉Eclipse开发工具、Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技术、I/O与反射、多线程、Swing程序与集合类

(2)JavaWeb和数据库

数据库、JavaWeb开发核心、JavaWeb开发内幕

推荐书籍:

《Effective Java中文版》(第2版)

这本书是学习java必备书籍,看完这本书也就掌握了入门的基础知识。

阶段二、 Linux&Hadoop生态体系

学习大数据离不开hadoop,围绕hadoop有一套生态体系,分布式数据库Hbase、数据仓库Hive、数据迁移工具Sqoop、Flume分布式日志框架需要了解并掌握。

推荐书籍:

1、《Big Data》

2、《Hadoop权威指南》

3、《Hive编程指南》

阶段三、 分布式计算。

(1)分布式计算框架

Python编程语言、Scala编程语言、Spark大数据处理、Spark—Streaming大数据处理、Spark—Mlib机器学习、Spark—GraphX 图计算等

(2)storm技术架构体系

Storm原理与基础、消息队列kafka、Redis工具、zookeeper集群

推荐书籍:

1、《Learning Spark》

2、《Spark机器学习:核心技术与实践》

阶段四、机器学习和深度学习算法的学习,可以更好的利用大数据去处理问题。






丁哥带你玩编程


随着互联网技术的发展,大数据行业前景非常被看好,有很多朋友对大数据行业心向往之,却苦于不知道该如何下手,或者说学习大数据不知道应该看些什么书。作为一个零基础大数据入门学习者该看哪些书?今天就给大家分享几本那些不容错过的大数据书籍。

1、《数据挖掘》

这是一本关于数据挖掘领域的综合概述,本书前版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。

2、《Big Data》

这是一本在大数据的背景下,描述关于数据建模,数据层,数据处理需求分析以及数据架构和存储实现问题的书。这本书提供了令人耳目一新的全面解决方案。但不可忽略的是,它也引入了大多数开发者并不熟悉的、困扰传统架构的复杂性问题。本书将教你充分利用集群硬件优势的Lambda架构,以及专门用来捕获和分析网络规模数据的新工具,来创建这些系统。

3、《Mining of Massive Datasets》

这是一本书是关于数据挖掘的。但是本书主要关注极大规模数据的挖掘,也就是说这些数据大到无法在内存中存放。由于重点强调数据的规模,所以本书的例子大都来自Web本身或者Web上导出的数据。另外,本书从算法的角度来看待数据挖掘,即数据挖掘是将算法应用于数据,而不是使用数据来“训练”某种类型的机器学习引擎。


分享到:


相關文章: