当前位置: 首页 > news >正文

PgSQL内核机制 - 算子执行统计元组个数

PgSQL内核机制 - 算子执行统计元组个数

我们在执行explain analyze观察执行计划执行情况时,时常通过每个算子实际执行结果来分析SQL的执行,其中有一项“rows = XXX”表示执行的行数(这里姑且先认为是执行的真实行数)。但有些场景下,比如MergeJoin,如下:

5cdb7d6272cac5c04b13e3fe8e8e7362.png

可以看到内表t1的SeqScan算子扫描出8行记录,而排序Sort算子仅4个,难道不是应该8个元组都进行排序吗?

那我们得重新理解下rows这个字段的意义了。

1、merge join的操作

具体状态机可以参考:PostgreSQL/GreenPlum Merge Inner Join解密

我们以文章开头的例子继续进行说明:

3fc252f7f87ad3c31d5d8e5d14b62405.png

1)先取外表t2的1;然后取内表1进行join条件判断

2)两者相等,标记内表位置1

3)取内表下一个值2,并保存到mj_InnerTupleSlot中,外表值1和内表2进行比较:1 < 2

4)取外表下一个值2,和标记位置1进行比较,2 > 1,则继续和内表当前保存的mj_InnerTupleSlot值进行比较

5)两者相等,标记内表位置2

6)取内表下一个值3,并将其保存到mj_InnerTupleSlot;外表2和内表3比较:2 < 3

7)取外表下一个值3,和内表标记位置2比较:3 > 2,继续和内表保存值mj_InnerTupleSlot比较:3 = 3

8)继续取内表下一个值4。外表3和内表4比较:3 < 4

9)外表值取完,终止join

可以从流程中看到,从内表只取出了4个值。这个正好和rows字段值匹配。也就是从子节点拿多少数据,rows输出多大值。

我们从代码中查看下是否是这样。

2、rows统计

结构体Instrumentation中的tuplecount输出到explain analyze中进行展示:如下图所示

420cb31afc7fe87e931942a37dcc349f.png

ExecMergeJoin每次从内表即Sort节点取一个数据,都会统计到Instr->tuplecount中。ExplainNode最终输出结果时,将Instr->tuplecount统计到instr->ntuples中。最终的rows值为ntuples/nloops,从执行计划中可以看到该算子仅进行了一次循环执行,即nloops为1。所以,可以这么理解:从Sort节点取出多少值,就会统计到rows中进行展示。

Rows的意义:子节点向父节点输出元组的个数,并不是子节点拥有的元组个数!

http://www.lryc.cn/news/353324.html

相关文章:

  • Ubuntu/Linux 安装Paraview
  • 内存泄漏及其解决方法
  • Java进阶学习笔记13——抽象类
  • 【Docker学习】深入研究命令docker exec
  • C语言中的文件操作
  • python使用xlrd读取excel的时候把字符串读成了数字
  • 【C语言】走进指针世界(下卷)
  • 【Spring】SSM整合_入门代码实现
  • C++代码错误解决1(函数模板)
  • idea configuration 配置 方便本地启动环境切换
  • win10配置wsl的深度学习环境
  • 如何处理时间序列的缺失数据
  • fastapi中实现多个路由请求
  • 前端框架选择指南:React vs Vue vs Angular
  • 猫头虎 解析:为什么AIGC在国内适合做TOB,在国外适合做TOC?
  • 并发编程笔记8--ThreadLocal结构详解
  • 强烈推荐 20.7k Star!企业级商城开源项目强烈推荐!基于DDD领域驱动设计模型,助您快速掌握技术奥秘,实现业务快速增长
  • 【C++STL详解(四)------vector的模拟实现】
  • 租赁系统|北京租赁系统|租赁软件开发流程
  • JAVA面试题大全(十四)
  • Web Accessibility基础:构建无障碍的前端应用
  • 谈谈你对 SPA 的理解?
  • JAVA给一个JSON数组添加对象
  • 设计一个完美的用户角色权限表
  • Git 基本使用
  • LabVIEW使用PID 控制器有哪些应用场景?
  • UTC与GPS时间转换-[week, sow]
  • JVM性能调优:内存模型及垃圾收集算法
  • 不靠后端,前端也能搞定接口!
  • 如何秒杀Promise面试题