当前位置: 首页 > news >正文

Spark资源规划-资源上线评估

1、总体原则

以单台服务器 128G 内存,32 线程为例。
先设定单个 Executor 核数,根据 Yarn 配置得出每个节点最多的 Executor 数量,每个节点的 yarn 内存/每个节点数量=单个节点的数量
总的 executor 数=单节点数量*节点数。

2、具体提交参数

1)executor-cores
每个 executor 的最大核数。根据经验实践,设定在 3~6 之间比较合理。
2)num-executors
该参数值=每个节点的 executor 数 * work 节点数
每个 node 的 executor 数 = 单节点 yarn 总核数 / 每个 executor 的最大 cpu 核数考虑到系统基础服务和 HDFS 等组件的余量,yarn.nodemanager.resource.cpu-vcores 配 置为: 28,参数 executor-cores 的值为:4,那么每个 node 的 executor 数 = 28/4 = 7,假设集
群节点为 10,那么 num-executors = 7 * 10 = 70
3)executor-memory
该参数值=yarn-nodemanager.resource.memory-mb / 每个节点的 executor 数量
如果 yarn 的参数配置为 100G,那么每个 Executor 大概就是 100G/7≈14G, 同时要注意yarn 配置中每个容器允许的最大内存是否匹配。

Spark的提交参数

		spark-submit常用参数--master 指定任务提交到哪个资源调度器中--executor-memory 指定每个executor的内存大小--executor-cores 指定每个executor的cpu核数--total-executor-cores 指定所有executor的cpu总核数[仅限于standalone模式使用]--num-executors 指定任务需要的executor个数[仅限于yarn模式使用]--queue 指定任务提交到哪个资源队列中[仅限于yarn模式使用]--deploy-mode 指定任务的部署模式[client/cluster]--driver-memory 指定driver的内存大小--class 指定待运行的带有main方法object的全类名
http://www.lryc.cn/news/232703.html

相关文章:

  • RT-Thread STM32F407 定时器
  • C#asp.net考试系统+sqlserver
  • mac上配置maven
  • 解决vue-cli node-sass安装不成功问题
  • 【Mysql】Mysql内置函数介绍
  • 【Linux】vscode远程连接ubuntu失败
  • 如何设计开发一对一交友App吸引更多活跃用户
  • UE基础篇六:音频
  • vscode+python开发之虚拟环境和解释器切换
  • vite 样式按需加载
  • Flutter打包iOS过程中pod访问github失败
  • 使用VMware安装linux虚拟机
  • Kafka、RocketMQ、RabbitMQ的比较总结Kafka、RocketMQ、RabbitMQ的比较总结
  • r语言plot函数
  • Notepad++ 和正则表达式 只保留自己想要的内容
  • SELinux零知识学习十、SELinux策略语言之客体类别和许可(4)
  • String字符串性能优化的几种方案
  • 微服务基础,分布式核心,常见微服务框架,SpringCloud概述,搭建SpringCloud微服务项目详细步骤,含源代码
  • 【第2章 Node.js基础】2.7 Node.js 的流(一) 可读流
  • Ubuntu/Debian Hat 系 Linux 使用
  • php接口api数据签名及验签
  • 实战:给docusaurus文档网站配置Algolia 实现全站内容搜索功能-2023.11.16(已解决)
  • Ubuntu18.04安装ROS系统+turtle测试
  • UE基础篇五:动画
  • SELinux零知识学习十二、SELinux策略语言之客体类别和许可(6)
  • vscode的git 工具使用
  • 利用回溯绕过正则表达式
  • Flutter执行flutter doctor报错HTTP Host Availability
  • 全栈工程师必须要掌握的前端Html技能
  • 腾讯云服务器租用价格,腾讯云服务器租用价格多少钱一年?