🦄 个人主页—🎐开着拖拉机回家_Linux,Java基础学习,大数据运维-CSDN博客 🎐✨🍁

感谢点赞关注每天进步一点点!加油!

目录

一、YARN概述

二、YARN基础架构

2.1 ResourceManager(RM)

2.1.1 Scheduler


一、YARN概述


Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一资源管理调度,它的引入集群利用率、资源统一管理数据共享等方面带来了巨大好处。




ResourceManager(RM)RM是一个全局资源管理器,负责整个系统资源管理分配。它主要由两个组件构成:调度器(Scheduler 应用程序管理器(Applications Manager,ASM)





NodeManager 是 yarn 节点的一个“工作进程代理管理 hadoop 集群中独立计算节点,主要负责与 ResourceManager 通信,负责启动管理应用程序container 的生命周期监控它们的资源使用情况( cpu 和内存),跟踪节点的监控状态,管理日志等。并报告给RM。




Application Submission Context 发出响应,其中包含有:ApplicationId用户名,队列以及其他启动 ApplicationMaster 的信息

Container Launch Context(CLC)也会发给 ResourceManager,CLC提供了资源的需求,作业文件安全令牌以及在节点启动 ApplicationMaster 所需要的其他信息

当 ResourceManager 接收到客户端提交的上下文,就会给 ApplicationMaster 调度一个可用的 Container(通常称为container0)。然后ResourceManager就会联系 NodeManager 启动 ApplicationMaster,并建立 ApplicationMaster 的 RPC 端口用于跟踪的 URL ,用来监控应用程序的状态。




YARN 任务在WEB页面上可以看资源使用和运行情况,ResourceManager IP:8088

如下也可以看到各个NM上的内存和 CPU核数使用情况



发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注