当前位置: 首页 > news >正文

Spark低版本适配Celeborn

Spark-3.5版本以下使用Celeborn时,无法使用动态资源,对于低版本的Spark,Celeborn提供了patch。各版本patch如下

https://github.com/apache/incubator-celeborn/tree/main/assets/spark-patch

下载patch,这里下载spark-3版本,将Celeborn_Dynamic_Allocation_spark3_3.patch放至spark-3.3.1源码目录下,和core同一层级,执行如下命令代码合并

patch -p1 < Celeborn_Dynamic_Allocation_spark3_3.patch

重新编译spark源码,并生成spark tgz包

./dev/make-distribution.sh --tgz --name custom-spark -Phadoop-3.2 -Dhadoop.version=3.2.1 \-Phive-3.2.1 -Phive-thriftserver -Pyarn -DskipTests

提交任务

 /opt/apps/SPARK3/spark-3.3.1-bin-custom-spark/bin/spark-submit \
--conf spark.shuffle.manager=org.apache.spark.shuffle.celeborn.SparkShuffleManager \
--conf spark.celeborn.client.spark.shuffle.writer=hash \
--conf spark.serializer=org.apache.spark.serializer.KryoSerializer \
--conf spark.celeborn.master.endpoints=celeborn-master:9097 \
--conf spark.sql.adaptive.enabled=true \
--conf spark.sql.adaptive.skewJoin.enabled=false \
--conf spark.celeborn.client.push.replicate.enabled=false \
--conf spark.dynamicAllocation.enabled=true \
--conf spark.shuffle.service.enabled=false \
--conf spark.celeborn.storage.hdfs.dir=hdfs://hdfs-cluster/celeborn \
--conf spark.dynamicAllocation.initialExecutors=10 \
--conf spark.dynamicAllocation.minExecutors=0 \
--conf spark.dynamicAllocation.maxExecutors=10 \
--conf spark.dynamicAllocation.executorIdleTimeout=30s \
--queue dataAnalysis \
--class com.rs.dsp.etl.jobs.CommonUserTrackSessionDetailD \
--master yarn \
--deploy-mode cluster \
--driver-memory 4GB \
--executor-memory 15G \
--executor-cores 2 \
/root/rs-dsp-spark-1.0-SNAPSHOT-jar-with-dependencies.jar

http://www.lryc.cn/news/254864.html

相关文章:

  • idea报错:Error:java: 不允许在使用 -release 时从系统模块 java.xml 导出程序包?
  • Vector Quantized Diffusion Model for Text-to-Image Synthesis
  • solidity实现ERC1155多代币标准
  • 10、外观模式(Facade Pattern,不常用)
  • <软考>软件设计师-3程序设计语言基础(总结)
  • C/C++---------------LeetCode第278. 第一个错误的版本
  • C语言三种循环输出9*9乘法表
  • IntelliJ IDEA 之初体验
  • java中synchronized和Lock的区别是什么?
  • ESP32-Web-Server编程-通过 Base64 编码在网页中插入图片
  • 聊一聊大模型 | 京东云技术团队
  • pandas空格及网页空格符NBSP替换处理
  • 智能优化算法应用:基于战争策略算法无线传感器网络(WSN)覆盖优化 - 附代码
  • 数据结构和算法-栈
  • C#基础与进阶扩展合集-进阶篇(持续更新)
  • 快速入门GitHub 之超简单的注册方法和超好用的使用技巧
  • ESP32-Web-Server编程- 在 Web 上开发动态纪念册
  • 双向ESD保护 汽车级TVS二极管 ESD9B3.3ST5G工作原理、特性参数、封装形式
  • Ribbon-IRule 修改负载均衡的规则
  • 双十二电视盒子哪个牌子最好?自费3000+测评整理电视盒子推荐
  • 排序:直接选择排序
  • Nacos多数据源插件
  • 【Java基础篇 | 面向对象】—— 聊聊什么是接口(上篇)
  • golang实现函数yamlToStruct(infile,outFile)
  • 产品成本收集器流程演示
  • 【微服务】springboot整合quartz使用详解
  • Electron+Ts+Vue+Vite桌面应用系列:TypeScript常用时间处理工具
  • 记录 | centos源码编译bazel
  • 常见的Bean工厂后置处理器
  • 代码随想录算法训练营第四十二天| 416 分割等和子集