当前位置: 首页 > news >正文

Spark_spark参数配置优先级

总结 :

优先级低-》优先级高

spark-submit 提交的优先级 < scala/java代码中的配置参数 < spark SQL hint

spark submit 中提交参数

#!/usr/bin/env bashsource /home/work/batch_job/product/common/common.sh
spark_version="/home/work/opt/spark"
export SPARK_CONF_DIR=${spark_version}/conf/
spark_shell="/home/opt/spark/spark3-client/bin/spark-shell"
spark_sql="/home/work/opt/spark/spark3-client/bin/spark-sql"
echo ${spark_sql}
echo ${spark_shell}
${spark_shell} --master yarn \--queue test \--name "evelopment_sun-data-new_spark_shell" \--conf "spark.speculation=true" \--conf "spark.network.timeout=400s" \--conf "spark.executor.cores=2" \--conf "spark.executor.memory=4g" \--conf "spark.executor.instances=300" \--conf "spark.driver.maxResultSize=4g" \--conf "spark.sql.shuffle.partitions=800" \--conf "spark.driver.extraJavaOptions=-Dfile.encoding=utf-8" \--conf "spark.executor.extraJavaOptions=-Dfile.encoding=utf-8" \--conf "spark.driver.memory=8g" \--conf "spark.sql.autoBroadcastJoinThreshold=-1" \--conf "spark.sql.turing.pooledHiveClientEnable=false" \--conf "spark.sql.hive.metastore.jars=/home/work/opt/spark/spark3-client/hive_compatibility/*" \--conf "spark.driver.extraClassPath=./__spark_libs__/hive-extensions-2.0.0.0-SNAPSHOT.jar:./hive_jar/parquet-hadoop-bundle-1.6.0.jar:/home/work/opt/spark/spark3-client/hive_compatibility/parquet-hadoop-bundle-1.6.0.jar" \--conf spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version=2 \--conf "spark.sql.legacy.timeParserPolicy=LEGACY" \--conf "spark.sql.storeAssignmentPolicy=LEGACY" \--conf spark.executor.extraJavaOptions="-XX:+UseG1GC" \--jars ./online-spark-1.0-SNAPSHOT.jar

scala/java代码中的配置参数

    val conf = new SparkConf().setAppName(s"production_data-new_UserOverview_${event_day}")val spark = SparkSession.builder().config("spark.debug.maxToStringFields", "500").config(conf).getOrCreate()

SQL hint

SELECT /*+ MERGEJOIN(t2) */ * FROM t1 INNER JOIN t2 ON t1.key = t2.key;

Hints - Spark 3.5.0 hints Documentation

http://www.lryc.cn/news/247846.html

相关文章:

  • ElasticSearch之Search settings
  • 二十二、数组(4)
  • 『 MySQL数据库 』CRUD之UD,表的数据更新(修改)及删除
  • 贪心算法及相关例题
  • 给企业做公众号运营你都有哪些宝贵经验?
  • 2023亚太地区数学建模B题思路分析+模型+代码+论文
  • Electron+Ts+Vue+Vite桌面应用系列:sqlite增删改查操作篇
  • c语言编程题经典100例——(36~40例)
  • SQL Server实现参数化增删改查Class类
  • 【Linux】 sudo命令使用
  • Redis key的类型以及命令
  • 数组元素积的符号
  • 数据脱敏方案
  • 蓝桥杯每日一题2023.11.28
  • 【数据库连接池】01:连接池初始化
  • Java基于springboot开发的土特产网站商城多商家源码
  • Linux CentOS7 LVM
  • ArkTS开发webview,html页面中的input和按钮等操作均无响应 【Bug已解决-鸿蒙开发】
  • 滴滴、阿里云、语雀相继宕机,损失巨大,软件的高可用失效了么?
  • 基于binlog实现一些业务(Binlog4j)
  • python实现rpc的几种方式(SimpleXMLRPCServer 自带的、第三方ZeroRPC)、连接linux远程开发分布式锁、分布式id
  • ARM麒麟V10 auditctl启动失败处理
  • day67
  • 04:2440---内存控制器
  • 【深度学习】CNN中pooling层的作用
  • 基于H1ve一分钟搭好CTF靶场
  • 网络篇---第五篇
  • Git——Git应用入门
  • 【SpringBoot】Redisson 分布式锁注解和 @Transactional 注解一起使用问题
  • Druid数据库连接池框架