本书从应用角度系统讲解了 YARN 的基本库和组件用法、应用程序设计方法、YARN 上流行的各
种计算框架(MapReduce、Tez、Storm、Spark),以及多个类 YARN 的开源资源管理系统(Corona 和
Mesos);从源代码角度深入分析 YARN 的设计理念与基本架构、各个组件的实现原理,以及各种计算
框架的实现细节。
全书共四部分 13 章:第一部分(第 1~2 章)主要介绍了如何获取、阅读和调试 Hadoop 的源代码,
以及 YARN 的设计思想、基本架构和工作流程 ;第二部分(第 3~7 章)结合源代码详细剖析和讲解了
YARN 的第三方开源库、底层通信库、服务库、事件库的基本使用和实现细节,详细讲解了 YARN 的
应用程序设计方法,深入讲解和分析了 ResourceManager、资源调度器、NodeManager 等组件的实现细
节;第三篇(第 8~10 章)则对离线计算框架 MapReduce、DAG 计算框架 Tez、实时计算框架 Storm 和
内存计算框架 Spark 进行了详细的讲解 ;第四部分(第 11~13 章)首先对 Facebook Corona 和 Apache
Mesos 进行了深入讲解,然后对 YARN 的发展趋势进行了展望。附录部分收录了 YARN 安装指南、
YARN 配置参数以及 Hadoop Shell 命令等非常有用的资料。
Hadoop这本书共300多页,需要的小伙伴可以转发+评论,关注我,然后私信回复【资料】即可打包获取哦!(免费的啦~)
本书分为四大部分(不包括附录):
第一部分为基础篇(第 1 ~ 2 章),简单地介绍 Hadoop YARN 的环境搭建和基本设计
架构,帮助读者了解一些基础背景知识。
第二部分为 YARN 核心设计篇(第 3 ~ 7 章),着重讲解 YARN 基本库、应用程序设
计方法和运行时环境的实现,包括 ResourceManager、NodeManager 和资源调度器等关键组
件的内部实现细节。
第三部分为计算框架篇(第 8 ~ 10 章),主要讲解当前比较流行的可运行在 YARN 上
的计算框架,包括离线计算框架 MapReduce、DAG 计算框架 Tez、实时计算框架 Storm 和
内存计算框架 Spark。
第四部分为高级篇(第 11 ~ 13 章),主要介绍了几个类似于 Hadoop YARN 的开源资
源管理系统,包括 Corona、Mesos 等,并总结了资源管理系统的特点及发展趋势。
另外本书最后还添加了几个附录 :附录 A 为 YARN 安装指南 ;附录 B 介绍了常见的
YARN 配置参数;附录 C 介绍了常用的 Hadoop Shell 命令;附录 D 为本书的所有参考资料,
包括参考论文、Hadoop jira 和网络资源等
Hadoop这本书共300多页,需要的小伙伴可以转发+评论,关注我,然后私信回复【资料】即可打包获取哦!(免费的啦~)
友情提示:以上所有文档资料,均可分享哦,有需要的朋友,转发+评论,关注我,然后私信回复【资料】即可打包获取哦!(免费的啦~)
閱讀更多 肥貓三千問 的文章