当前位置: 首页 > news >正文

Spark提交任务

1、Spark提交任务到Yarn

1.1、DwKuduApp

spark-submit --class com.io.etl.dwkudu.DwKuduApp \
--files /etl/etl-dwkudu/conf/doris.property,/etl/etl-dwkudu/conf/redis.property,/etl/etl-dwkudu/conf/log4j.property \
--master yarn --deploy-mode cluster \
--driver-memory 2g \
--executor-memory 7g \
--conf "spark.executor.cores=2" \
--conf "spark.yarn.maxAppAttempts=0" \
--conf "spark.task.maxFailures=1" \
--conf "spark.dynamicAllocation.enabled=false" \
--conf "spark.executor.instances=8" \
--conf "spark.yarn.executor.memoryOverhead=1024m" \
--conf "spark.executor.extraJavaOptions=-Dlog4j.configration=log4j_dwkudu.properties -XX:+UseG1GC" \
--conf "spark.streaming.kafka.maxRatePerPartition=$datacount" \
/etl/etl-dw-kudu/etl-dw-kudu.jar $period > /etl-log/etl-dw-kudu/etl-dw-kudu.log

1.1、GateAppetl

spark-submit --class com.io.etl.gate.GateAppetl \
--files /etl/gate/conf/doris.property,/etl/gate/conf/redis.property,/etl/gate/conf/log4j.property \
--master yarn --deploy-mode cluster \
--driver-memory 600m \
--executor-memory 1g \
--conf "spark.executor.cores=1" \
--conf "spark.yarn.maxAppAttempts=0" \
--conf "spark.yarn.task.maxFailures=1" \
--conf "spark.dynamicAllocation.enabled=false" \
--conf "spark.executor.instances=8" \
--conf "spark.yarn.executor.memoryOverhead=1524m" \
--conf "spark.executor.extraJavaOptions=-Dlog4j.configuration=log4j_gate.properties -XX:+UseG1GC -verbose:gc -XX:PrintGCTimeStamps" \
--conf "spark.streaming.kafka.maxRatePerPartition=1000" \
/etl/etl-gate/etl-gate.jar 10 > /etl-log/etl-dw-kudu/etl-gate.log

1.1、PayKuDuIdApp

spark-submit --class com.io.etl.PayKuDuIdApp \
--files /etl/gate/conf/doris.property,/etl/gate/conf/redis.property,/etl/gate/conf/log4j.property \
--master yarn --deploy-mode cluster \
--driver-memory 2048m \
--executor-memory 4g \
--conf "spark.executor.cores=1" \
--conf "spark.yarn.maxAppAttempts=0" \
--conf "spark.yarn.task.maxFailures=1" \
--conf "spark.dynamicAllocation.enabled=false" \
--conf "spark.executor.instances=4" \
--conf "spark.yarn.executor.memoryOverhead=2048m" \
--conf "spark.driver.extraJavaOptions=-Dfileencoding=utf-8" \
--conf "spark.executor.extraJavaOptions=-Dlog4j.configuration=log4j_id.properties -Dfile.encoding=utf-8 -XX:+UseG1GC -verbose:gc -XX:PrintGCDetails +XX:+PrintGCTimeStamps" \
--conf "spark.streaming.kafka.maxRatePerPartition=12000" \
/etl/etl-id-kudu/etl-id-kudu.jar 2 3000 > /etl-log/etl-id-kudu/etl-id-kudu.log
http://www.lryc.cn/news/540101.html

相关文章:

  • 游戏引擎学习第113天
  • token是什么
  • 23. AI-大语言模型-DeepSeek赋能开发-Spring AI集成
  • IPv6报头40字节具体怎么分配的?
  • 驱动开发、移植
  • BFS与Flood Fill:算法原理、实现细节与复杂度分析
  • 计算机网络基础杂谈(局域网、ip、子网掩码、网关、DNS)
  • 雷龙CS SD NAND(贴片式TF卡)测评体验
  • 【Alertmanager】alertmanager告警系统原理剖析与应用实战,应有尽有非常全面
  • Java——权限修饰符
  • 一周学会Flask3 Python Web开发-redirect重定向
  • python面向对象:方法
  • 物联网简介集合
  • centos下使用pyenv管理python版本
  • C++:类与对象,定义类和构造函数
  • 【Java消息队列】应对消息丢失、重复、顺序与积压的全面策略
  • 解锁机器学习核心算法|神经网络:AI 领域的 “超级引擎”
  • Android14(13)添加墨水屏手写API
  • flyway的ignoreMigrationPatterns
  • 25年2月通信基础知识补充:多普勒频移与多普勒扩展、3GPP TDL信道模型
  • 华为动态路由-OSPF-骨干区
  • 接口测试-API测试中常用的协议(中)
  • 植物大战僵尸杂交版v3.2.1最新版本(附下载链接)
  • java每日精进 2.20 MQ相关复健
  • 【设计模式精讲】结构型模式之代理模式(静态代理、JDK动态代理、cglib动态代理)
  • 京东广告基于 Apache Doris 的冷热数据分层实践
  • win11 安装pyenv来管理python
  • 【AI】GitHub Copilot
  • 【LeetCode 热题100】76. 最小覆盖子串的算法思路及python代码
  • 力扣-回溯-17 电话号码的字母组合