当前位置: 首页 > article >正文

spark-AQE/Tungsten介绍及其触发条件

目录

    • 1、简介
    • 2、AQE(自适应查询优化)触发条件及配置
    • 3、Tungsten(钨丝计划)触发条件及配置

1、简介

  1. AQE(Adaptive Query Execution)

    • 定义:Spark 3.0引入的自适应查询优化技术运行时动态调整执行计划
    • 核心能力
      • 动态分区合并:自动合并小分区以减少Shuffle数据量。
      • 自动Broadcast Join:根据数据量动态切换Join策略。
      • Skew Join优化:识别数据倾斜并自动调整分区策略。
    • 配置参数
      spark.sql.adaptive.enabled=true
      spark.sql.adaptive.skewJoin.enabled=true
      
  2. Tungsten(钨丝计划)

    • 定义:Spark 1.6推出的底层性能优化框架,通过内存管理和代码生成提升效率。
    • 关键技术
      • 内存列式存储:减少内存占用并提升缓存利用率。
      • 代码生成(Codegen):动态生成JVM字节码替代解释执行。
      • Sort-Based Shuffle优化:基于内存的排序减少磁盘I/O。
    • 触发条件:需满足特定配置(如spark.sql.shuffle.partitions设置合理)。

2、AQE(自适应查询优化)触发条件及配置

  • 生效条件

    • Spark 3.0+ 版本,且作业中至少存在一次 Shuffle 操作。
    • 需通过以下参数显式启用:
      set
http://www.lryc.cn/news/2395743.html

相关文章:

  • leetcode-hot-100 (矩阵)
  • 深度学习中常见的超参数对系统的影响
  • 评标专家系统随机抽选 开发 Excel 中使用东方仙盟软件助理——未来之窗——仙盟创梦IDE
  • MySQL、PostgreSQL、Oracle 区别详解
  • 【第4章 图像与视频】4.6 结合剪辑区域来绘制图像
  • 【Linux】Linux文件系统详解
  • IDEA使用Git进行commit提交到本地git空间后撤回到commit版本之前
  • LangChain完全指南:从入门到精通,打造AI应用开发新范式
  • 深入解析Vue.js:构建现代Web应用的高效之道
  • VS Code / Cursor 将默认终端设置为 CMD 完整指南
  • mybatis plus的源码无法在idea里 “download source“
  • 移动安全Android——客户端数据安全
  • Python包管理器 uv替代conda?
  • 数据库系统概论(十)SQL 嵌套查询 超详细讲解(附带例题表格对比带你一步步掌握)
  • Git仓库大文件清理指南
  • 华为OD机试真题——最小矩阵宽度(宽度最小的子矩阵)(2025A卷:200分)Java/python/JavaScript/C/C++/GO最佳实现
  • 苹果公司计划按年份来重命名重大的软件,将升级iOS 18软件至iOS 26
  • 园区智能化集成平台汇报方案
  • 奥威BI+AI——高效智能数据分析工具,引领数据分析新时代
  • Spark on Hive表结构变更
  • python做题日记(11)
  • 2025——》NumPy中的np.logspace使用/在什么场景下适合使用np.logspace?NumPy中的np.logspace用法详解
  • STM32F407VET6学习笔记8:UART5串口接收中断的Cubemx配置
  • UE5.5 pixelstreaming插件打包报错
  • Python Django完整教程与代码示例
  • Spring Boot,两种配置文件
  • OpenLayers 地图标注之图文标注
  • 设计模式——简单工厂模式(创建型)
  • qt ubuntu 20.04 交叉编译
  • java中cocurrent包常用的集合类操作