当前位置: 首页 > news >正文

Spark 平障录

Profile

Profile 是最重要的第一环。

  • 利用好 spark UI 和 yarn container log
  • 分析业务代码,对其计算代价进行预判
  • 建设基准,进行对比,比如application id 进行对比,精确到 job DAG 环节
充分利用 UI
Stage 页面

页头 summary,也很重要。
在这里插入图片描述

勾选所有 UI metrics,提供判断依据

在这里插入图片描述

task 维度 metrics

在这里插入图片描述

在这里插入图片描述

Executor 维度

在这里插入图片描述

application id 对比

如果两个application id, shuflfle read/write 差不多,input/output 差不多。
慢的那一个,如果内存消耗大,那说明计算量大,比如 sum, count 等

Executor 页面

选中所有 metrics,增加判断依据
在这里插入图片描述

注意GC
在这里插入图片描述

http://www.lryc.cn/news/236242.html

相关文章:

  • 基于一致性算法的微电网分布式控制MATLAB仿真模型
  • Android 10.0 系统修改usb连接电脑mtp和PTP的显示名称
  • 飞鼠异地组网工具实战之访问k8s集群内部服务
  • 【Flink】窗口(Window)
  • 读像火箭科学家一样思考笔记03_第一性原理(上)
  • npm私有云
  • 莹莹API管理系统源码附带两套模板
  • 【Kingbase FlySync】命令模式:安装部署同步软件,实现KES到KES实现同步
  • python使用selenium webDriver时 报错
  • 【ROS2机器人入门到实战】
  • Nuxt3框架局部文件引用外部JS/CSS文件的相关配置方法
  • Docker 可视化面板 ——Portainer
  • Java 教育局民办教育信息服务与监管平台
  • 小迪笔记(1)——操作系统文件下载反弹SHELL防火墙绕过
  • Pytorch D2L Subplots方法对画图、图片处理
  • MATLAB算法实战应用案例精讲-【目标检测】YOLOV5(补充篇)
  • WPF中可视化树和逻辑树的区别是什么
  • 小迪安全笔记(2)——web应用架构搭建漏洞HTTP数据包代理服务器
  • [AI]ChatGPT4 与 ChatGPT3.5 区别有多大
  • node实战——koa实现文件上传
  • C++中的this指针
  • 分析日志的一般套路
  • 使用Flink处理Kafka中的数据_题库子任务_Java语言实现
  • k8s运维管理
  • 【最新Tomcat】IntelliJ IDEA通用配置Tomcat教程(超详细)
  • 安装2023最新版PyCharm来开发Python应用程序
  • 【c++随笔13】多态
  • 数据结构【DS】图的应用
  • 图像滤波处理
  • 中间件安全:Apache 目录穿透.(CVE-2021-41773)