当前位置: 首页 > news >正文

【大数据】YARN节点标签Node Label特性

简介

YARN 的 Node-label 特性能够将不同的机器类型进行分组调度,也可以根据不同的资源要求进行分区调度。运维人员可以根据节点的特性将其分为不同的分区来满足业务多维度的使用需求。YARN的Node-label功能将很好的试用于异构集群中,可以更好地管理和调度混合类型的应用程序。

开启Node-label

默认情况下系统时没有开启node label标签功能的,可以在yarn-site.xml中修改下列配置来开启label特性。

  <!-- Yarn Node Labels --><property><name>yarn.node-labels.enabled</name><value>true</value></property><property><name>yarn.node-labels.manager-class</name><value>org.apache.hadoop.yarn.server.resourcemanager.nodelabels.RMNodeLabelsManager</value></property><property><name>yarn.node-labels.fs-store.root-dir</name><value>hdfs://cdp-cluster/yarn/node-labels</value><description>标签数据在HDFS上的存储位置</description></property>

设置这个HDFS的Node-labels存储目录,是因为label信息默认是保存在内存中的,如果将label信息存于hdfs上,重启resourcemanager之后label信息不会因此丢失。

配置步骤:
先按上述要求修改yarn-site.xml并同步到集群各节点中,然后重启resourcemanager节点

添加集群便签

yarn rmadmin -addToClusterNodeLabels label_1,label_2

删除集群标签

bin/yarn rmadmin -removeFromClusterNodeLabels "label_1,label_2"

添加节点标签

yarn rmadmin -replaceLabelsOnNode spark-31:45454,label_1
yarn rmadmin -replaceLabelsOnNode spark-32:45454,label_2
yarn rmadmin -replaceLabelsOnNode spark-33:45454,label_2# 或者下面这种方式
# yarn rmadmin -replaceLabelsOnNode "spark-31=label_1 spark-32=label_2 spark-33=label_2"

需一个一个添加,节点较多时建议写成脚本执行

删除标签

yarn rmadmin -replaceLabelsOnNode "spark-33"

查看标签

yarn node -status spark-31:45454

也可以通过Yarn管理页面查看Node Label
node-label webUI 访问地址为 :http://RM-Address:port/cluster/nodelabels

将节点标签与队列关联

将节点标签与队列关联

(1)假设集群有8个节点:前3个节点(n1-n3)具有节点标签: x,后3个节点(n4-n6)具有节点标签= y,最后2个节点(n7,n8)没有任何节点标签;每个节点可以运行10个容器。

(2)现在分配资源如下:队列a可以访问节点标签x和y,队列b只能访问节点标签y;

(3)假设按这个需求去分配:队列a占用x 100%,占用y 50%,占用没有标签的40%;队列b占用y 50%,占用x 0%,占用没有标签的60%。

即:a(无)40% + b(无)60% = 1 n7,n8

a(x)100% + b(x)0 = 1 n1,n2,n3

a(y)50% + b(y)50% = 1 n4,n5,n6

(4)在(3)的基础上,a队列有子队列a1,a2;b队列只有b1子队列。

那么假设a1占用a(无)40%,a(x)30%,a(y)50%;a2占用a(无)60%,a(x)70,a(y)50%;

b1 占用b(无)100%,占用b(y)100%。

则具体的资源划分为:

a1:

无标签的节点(n7,n8)可用资源为:20(2个节点的总的容器) * a(无)40% * a1(无)40% = 3.2 个(container)
x标签节点(n1,n2,n3)可用资源为:30 * a(x)100% * a1(x)30% = 9 个(container)
y标签节点(n4,n5,n6)可用资源为:30 * a(y)50% * a1(y)50% = 7.5 个(container)
a2:

无标签的节点(n7,n8)可用资源为:20(2个节点的总的容器) * a(无)40% * a2(无)60% = 4.8 个(container)
x标签节点(n1,n2,n3)可用资源为:30 * a(x)100% * a1(x)70% = 21 个(container)
y标签节点(n4,n5,n6)可用资源为:30 * a(y)50% * a1(y)50% = 7.5 个(container)
b1:

无标签的节点(n7,n8)可用资源为:20(2个节点的总的容器) * b(无)60% * b1(无)100% = 12 个(container)
x标签节点(n1,n2,n3)可用资源为:30 * b(x)0 = 0 个(container)
y标签节点(n4,n5,n6)可用资源为:30 * b(y)50% * b1(y)50% * b1(y)100% = 15 个(container)
无:3.2+4.8+12=20;

x:9+21=30;

y:15 + 15=30;

http://www.lryc.cn/news/6516.html

相关文章:

  • C# SolidWorks二次开发 API-命令标签页的切换与按钮错乱问题
  • ElasticSearch 7.6.1
  • Linux系列 操作系统安装及服务控制(笔记)
  • Linux基础 - NTP时间同步
  • golang 入门教程:迷你 Twitter 后端
  • CPP2022-30-期末模拟测试03
  • 华为OD机试真题Python实现【最多等和不相交连续子序列】真题+解题思路+代码(20222023)
  • 二叉搜索树
  • 数据结构(三):集合、字典、哈希表
  • Linux内核驱动开发(一)
  • TCP/IP协议二十问
  • 常用Array数组操作方法
  • 【C++】set/multiset、map/multimap的使用
  • vue3语法
  • 对象之间的关系
  • 云原生时代顶流消息中间件Apache Pulsar部署实操-上
  • Python实现基于openCV+百度智能云平台实现《1:N人脸考勤机》文章最后附带源码!
  • 因为锁的问题,我们被扣了1万
  • 【STM32笔记】低功耗模式下的RTC唤醒(非闹钟唤醒,而是采用RTC_WAKEUPTIMER)
  • 浏览器渲染中的相关概念
  • 【MySQL】数据类型
  • L2-037 包装机
  • MySQL -查询日志、二进制日志、错误日志、慢查询日志
  • TCP实现可靠传输的实现
  • 2/14考试总结
  • 程序环境和预处理详解
  • The Social-Engineer Toolkit(社会工程学工具包)互联网第一篇全模块讲解
  • Windows11去掉不满足系统要求的提示水印
  • JavaScript 计时事件
  • 七大排序算法的多语言代码实现