当前位置: 首页 > news >正文

Catalyst优化器:让你的Spark SQL查询提速10倍

目录

1 逻辑优化阶段

2.1 逻辑计划解析

2.2 逻辑计划优化

2.2.1 Catalys的优化过程

2.2.2 Cache Manager优化

2 物理优化阶段

2.1 优化 Spark Plan

2.1.1 Catalyst 的 Join 策略

2.1.2 如何决定选择哪一种 Join 策略

2.2 Physical Plan

2.2.1 EnsureRequirements 规则

3 相关文章


Spark SQL 端到端的完整优化流程主要包括两个阶段:Catalyst 优化器和 Tungsten。其中,Catalyst 优化器又包含逻辑优化和物理优化两个阶段。为了把开发者的查询优化到极致,整个优化过程的运作机制设计得都很精密,

Spark SQL的优化过程

1 逻辑优化阶段

Catalyst 逻辑优化阶段分为两个环节:逻辑计划解析和逻辑计划优化。在逻辑计划解析中,
Catalyst 把“Unresolved Logical Plan”转换为“Analyzed Logical Plan”;在逻辑计划优化中,Catalyst 基于一些既定的启发式规则(Heuristics Based Rules),把“Analyzed
http://www.lryc.cn/news/409408.html

相关文章:

  • 【Hot100】LeetCode—416. 分割等和子集
  • 前端开发知识-vue
  • 【嵌入式硬件】快衰减和慢衰减
  • C语言 | Leetcode C语言题解之第275题H指数II
  • 速盾:网络安全和 CDN 之间的关系是怎样的?
  • 数据库安全:MySQL安全配置,MySQL安全基线检查加固
  • 【SpringBoot】参数传递
  • Unity 骨骼动画(Skinned Mesh Renderer): 角色动画的高级渲染
  • 花几千上万学习Java,真没必要!(三十四)
  • 【代码】Python3|Scrapy框架初探(汽车之家大连市二手车车辆数据爬取、清洗与可视化)
  • C#中的new以及类
  • Hbase简介和快速入门
  • 【AI落地应用实战】Amazon Bedrock +Amazon Step Functions实现链式提示(Prompt Chaining)
  • vue Ref 和 Reactive 原理解析
  • 【人工智能】Transformers之Pipeline(六):图像分类(image-classification)
  • 编程语言漫谈之「初始化与赋值」——以C++和汇编语言为示例
  • windows使用ssh-agent管理私钥
  • PostgreSQL 之 to_timestamp函数
  • USB3.0的等长要求到底是多少?
  • 力扣高频SQL 50题(基础版)第二十五题
  • 【C++题解】1581. 马里奥的银币1
  • system和popen函数的异同点
  • Python小工具之httpstat网络分析
  • 挑战房市预测领头羊:KNN vs. 决策树 vs. 线性回归
  • Docker 基础知识
  • 视频主题Qinmei 3.0视频站源码_WordPress影视视频主题/附详细安装教程
  • 数字看板:跨行业需求下的创新与升级
  • 02、爬虫数据解析-Re解析
  • 掀桌子了!原来是咱们的大屏设计太酷,吓着前端开发老铁了
  • JavaScriptfor循环的树形菜单栏·