01.28 Apache Hadoop YARN 的架构与运行流程_技术 _ 頭條網

Apache Hadoop YARN 的架构与运行流程。

YARN 概述

Yarn 是一个资源调度平台，负责为运算程序提供服务器计算资源，相当于一个分布式的操作系统平台，而 MapReduce、Spark、Flink 等运行程序则相当于运行于操作系统平台之上的应用程序。

YARN 产生的背景

Yarn 是 Hadoop2.X 版本中的一个新的特性。它的出现其实是为了解决第一代 MapReduce 编程框架的不足，提高集群环境下的资源利用率，这些资源包括了内存、磁盘、网络等等。

Hadoop2.X 版本中重新设计的这个 YARN 集群，具有更好的扩展性，可用性，可靠性，向后兼容性，以及能支持除 MapReduce 以外的更多分布式计算框架。

在 MapReduce 1.x 时的架构图如下：

从上图可以看到，1.x 时也是 Master/Slave 这种主从结构，在集群上的表现就是一个JobTracker 和多个 TaskTracker。

JobTracker：负责资源管理和作业调度TaskTracker：定期向 JobTracker 汇报本节点的健康状况、资源使用情况以及作业执行情况。还可以接收来自JobTracker的命令，例如启动任务或结束任务等。

那么，这种架构会存在哪些问题？

整个集群中只有一个 JobTracker，存在单点故障。JobTracker 节点压力大，不但要处理Client 的请求，还得处理 TaskTracker 的心跳等请求。由于 JobTracker 是单节点，所以容易成为集群中的瓶颈，不易扩展。JobTracker 负责的事情太多，基本上所有的事情都需要跟 JobTracker 进行交互。1.x 的整个集群只支持MapReduce 任务，不支持其他例如 Spark 的任务。

基于上面的种种原因，Hadoop 在 2.x 中对资源调度进行了剥离，形成了单独的组件，也就是 Yarn 。

YARN 的架构

Yarn 的架构图如下：

YARN 的基本思想是将资源管理和作业调度/监视的功能分解为单独的守护进程。它拥有一个全局 ResourceManager（RM）和每个应用程序 ApplicationMaster（AM）。应用程序可以是单个作业，也可以是作业的DAG（有向无环图，可以理解为对作业相互之间的依赖关系的一种描述）。

ResourceManager

ResourceManager 是基于应用程序对集群资源的需求进行调度的 YARN 集群主控节点，负责协调和管理整个集群（所有 NodeManager）的资源，响应用户提交的不同类型应用程序的解析，调度，监控等工作。ResourceManager 会为每一个 Application 启动一个 MRAppMaster，并且 MRAppMaster 分散在各个 NodeManager 节点　　它主要由两个组件构成：调度器（Scheduler）和应用程序管理器（ApplicationsManager， ASM）

ResourceManager 的职责：

处理客户端请求　　　　启动或监控 MRAppMaster　　　　监控 NodeManager　　　　资源的分配与调度

NodeManager

NodeManager是每台机器框架代理，负责容器（Container）的管理，监视其资源使用情况（CPU，内存，磁盘，网络）并将其报告给 ResourceManager / Scheduler。

NodeManager 的职责：　　　　

管理单个节点上的资源，开启容器。处理来自 ResourceManager 的命令　　　　处理来自 MRAppMaster 的命令

ApplicationMaster

每个程序都对应一个 ApplicationMaster，它负责向资源调度器申请执行任务的资源容器，运行任务，监控整个任务的执行，跟踪整个任务的状态，处理任务失败以异常情况。

Container

Container 容器是一个抽象出来的逻辑资源单位。容器是由 ResourceManager Scheduler 服务动态分配的资源构成，它包括了该节点上的一定量 CPU，内存，磁盘，网络等信息，MapReduce 程序的所有 Task 都是在一个容器里执行完成的，容器的大小是可以动态调整的。

YARN 执行流程

先上图，以 WordCount 的整个运行流程为例：

整个过程如下：

客户端所在的机器执行 job.submit() ,调用 YarnRunner 去向 ResourceManager 申请提交一个 application。ReourceManager 返回一个资源提交的地址 hdfs://xxx/.staging/application_id/ 和 application_id。因为后续的任务需要执行这些个资源文件，到这个阶段，还不了解每个任务到底会分配到哪台机器上，干脆直接给一个都能访问到的地址，任务到谁那里，就自己去这个位置拉取需要的jar 包和配置信息。YarnRunner 提交 job 所需要的资源文件到上面的地址。YarnRunner 提交资源完毕，向 ResourceManager 申请启动 MrAppMaster。ResourceManager 收到请求，然后封装成一个 task 放入任务队列，等待 NodeManager 获取执行，此队列默认使用FIFO。NodeManager1 把这次任务下载到本地。NodeManager1 下载 job 相关的文件，并在本地地启动一个 Container 运行 MrAppMaster ，container 就是一个容器，利用的是 linux 的 cgroup ,现在市面上的虚拟化技术底层也是使用的此技术。MrAppMaster 根据配置信息，去跟 ResourceManager 申请运行 maptask 的容器，还是跟第 5 步一样，ReourceManager 拿到后封装成一个task 放到任务队列。Nodemanager 2 和 3 分别下载上个步骤的 task 任务 ,然后在本地启动一个 container 容器。MrAppMaster 向第9 步新启动的容器发送拷贝文件、执行 maptask 等任务的命令。maptask 执行完成后，把数据写到自己本地，容器的工作目录。MrAppMaster 再向 YARN 请求资源来运行 reducetask 任务。reducetask 向 map 端获取相应的分区数据进行处理，处理完成后进行输出。整个 applicetion 执行完成后，MrAppMaster 向 ResourceManager 申请销毁自己。

Apache Hadoop YARN http://hadoop.apache.org/docs/stable/hadoop-yarn/hadoop-yarn-site/YARN.html

Hadoop学习之路（二十四）YARN的资源调度 https://www.cnblogs.com/qingyunzong/p/8615096.html

分布式资源调度——YARN框架 https://blog.51cto.com/zero01/2091635

YARN 概述

YARN 产生的背景

YARN 的架构

ResourceManager

NodeManager

ApplicationMaster

Container

YARN 执行流程

相關文章:

Apache Flink中保存点和检查点之间的3个区别

Apache Hive简介

Apache Doris在美团外卖数仓中的应用实践

Apache Kafka内核深度剖析

Apache HBase配置文件

Apache Shiro视频教程免费获取

Apache Atlas

一款高性能的OLAP分析工具-Apache Kylin 研究 （一）

Apache Pulsar：下一代分布式消息系统

Apache Windows部署

Apache Tomcat 7.0.x 将于明年3月31日结束生命周期

03.04 Apache Tomcat 7.0.x 将于明年3月31日结束生命周期

Apache Kafka作者谈架构演进（Java消息中间件）

Apache shiro反序列化漏洞排查

Apache Dubbo的爱奇艺之旅

Apache FreeMarker模板FusionAuth远程代码执行漏洞通告

Apache Flink 1.9.2 发布，流处理框架

Apache ab压力测试的知识点

11.23 apache kafka吞吐量高的原因分析

11.22 Apache Kafka和Apache NiFi集成

Apache Kafka快速入门指南

新一代MQ apache pulsar的架构与核心概念

Apache Shiro架构设计

深入了解 Apache Flink 的网络协议栈

Apache Sqoop文档~管理员手册

apache 403错误 Forbidden解决方法

Apache 基金会将其所有项目迁移至 GitHub

Apache Tomcat修补重要的远程执行代码漏洞

CVE-2019-0211：Apache HTTP服务组件提权漏洞分析

Apache Kylin目录详解

Apache HTTP存在提权漏洞，威胁共享Web主机安全性

Apache Mavibot

Apache Ignite上的TensorFlow

Apache Spark常见的三大误解

apache htpasswd命令用

Apache Kafka在大型应用中的20项最佳实践

apache flume介绍

apache，tomcat以及IIS三者之间的比较

Apache Flink新的稳定版本发布，流处理更牛了！

Apache Shiro 会话管理指南详解（一）

Apache Shiro 会话管理指南详解（二）

apache Hive介绍

Apache Shiro 10分钟入门教程

Apache Server搭建图片服务器

04.02 Apache Server搭建图片服务器

第二章 IoC容器和Bean配置

运算里不得不说的python模块—math

Devops度量--DevOps 现状快速检查表

SOP是什么（解读）

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

DNS侦查工具

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

（必收藏系列）Linux面试题——命令集

五分钟学会如何在 IPFS 上部署网站

「正点原子NANO STM32F103开发板资料连载」第29章 内存管理实验

小白怎么学Web前端开发 如何成为技术达人

如何开发一个web静态服务器

学Java编程还有前景吗 如何才能拿到高薪

Python网络爬虫之配置篇（一）

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

Python的运行效率太低？几行代码快速提升！

python的优点是什么？最新Python400集视频（附教程）

MySQL中OOM故障应如何下手-爱可生

像专家一样使用 panic

30种不同的编程语言怎么写“Hello, World”

percona QAN 介绍

面试官：你可以用纯CSS判断鼠标进入的方向吗？

一款高性能的OLAP分析工具-Apache Kylin 研究（一）

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

小白怎么学Web前端开发如何成为技术达人

学Java编程还有前景吗如何才能拿到高薪