当前位置: 首页 > news >正文

一条 SQL 语句的内部执行流程详解(MySQL为例)

当执行如下 SQL:

SELECT * FROM users WHERE id = 1;

在数据库内部,其实会经历多个复杂且有序的阶段。以下是 MySQL(InnoDB 引擎)中 SQL 查询语句从发送到结果返回的完整执行流程。


客户端连接阶段

  • 客户端(如 JDBC、MySQL Shell)通过 TCP 与 MySQL 服务器建立连接。
  • 连接器模块完成身份认证(用户名/密码)、权限校验。
  • 若使用连接池,连接可能已被复用。

语法分析阶段(Parser)

1. 词法分析(Lexical Analysis)

  • 将 SQL 字符串拆解成关键字、标识符、操作符等 Token。
  • 例子:SELECT, *, FROM, users, WHERE, id, =, 1

2. 语法分析(Syntax Analysis)

  • 依据 SQL 语法规则生成抽象语法树(AST)
  • 若语法不合法,此阶段抛出语法错误。

预处理阶段(Preprocessor)

  • 验证表/字段是否存在。
  • 检查当前用户是否有访问权限。
  • 解析字段别名、函数等表达式。
  • 确定查询涉及的表和列。
  • 最终输出逻辑查询结构

查询优化阶段(Optimizer)

优化器根据预处理阶段的语义结构生成最优执行计划(Execution Plan)

1. 访问路径选择

  • 使用 索引扫描 还是 全表扫描
  • 是否走覆盖索引,是否需要回表?

2. 连接顺序优化(Join Order)

  • 对多表 JOIN,决定访问顺序与连接方法(如 Nested Loop、Hash Join)。

3. 成本估算(Cost Estimation)

  • 评估每种执行方式的代价(IO 次数、内存使用等)。
  • 选择代价最小的执行路径。

查询执行阶段(Executor)

执行器根据优化器生成的执行计划与存储引擎交互,完成数据访问。

执行器主要职责:

  • 调用引擎接口访问表和索引。
  • 进行 WHERE 过滤、JOIN、聚合、排序、分组等操作。
  • 构造并返回最终结果集。

存储引擎访问阶段(以 InnoDB 为例)

MySQL 使用插件式存储引擎架构。以 InnoDB 为例:

  • 数据页首先尝试从 Buffer Pool(缓冲池)中读取。
  • 若不在缓冲池,则从磁盘读取并加入缓冲池。
  • 使用 B+ 树索引定位记录。
  • 如果为覆盖索引(索引包含查询列),可避免回表。
  • 对于非索引字段,需根据主键“回表”查找。

结果返回阶段

  • 执行器生成的结果集通过 MySQL 协议格式化。
  • 数据从服务器通过网络传输返回给客户端。
  • 客户端解析并展示结果。

日志与事务支持(InnoDB)

虽然 SELECT 查询本身不会写入日志,但其他 SQL 会涉及以下机制:

  • Undo Log:支持事务回滚、MVCC。
  • Redo Log:保证事务持久化(WAL机制)。
  • Binlog:记录变更操作,用于主从复制和恢复。

注:查询语句可能间接使用 undo log(如 MVCC)。


SQL 执行流程图

Client Connector Parser Preprocessor Optimizer Executor StorageEngine 提交 SQL 查询 权限校验、连接管理 语法分析、语义分析 检查字段/表、构造逻辑查询块 生成并下发最优执行计划 根据执行计划读取数据(可能命中索引) 返回数据页或记录 返回结果集 Client Connector Parser Preprocessor Optimizer Executor StorageEngine

使用 EXPLAIN 查看执行计划

EXPLAIN SELECT * FROM users WHERE id = 1;

查看字段含义:

  • id: 查询标识
  • select_type: 查询类型(SIMPLE/PRIMARY等)
  • table: 访问的表
  • type: 连接类型(ALL、index、range、ref、const 等)
  • key: 使用的索引
  • rows: 扫描的行数
  • Extra: 是否使用临时表、排序、是否回表等信息

查询性能影响因素

影响因素说明
是否走索引非索引字段将触发全表扫描
是否回表二级索引查询非索引字段时需根据主键回表
连接数与并发并发高时,CPU/IO/锁资源紧张
查询缓存MySQL 8.0 起已废弃
临时表与排序ORDER BY / GROUP BY 可能触发文件排序与临时表
网络延迟大结果集网络传输慢

总结

一条 SQL 查询的完整内部执行流程如下:

  1. 客户端连接 → 建立连接并认证
  2. 解析 SQL → 词法/语法分析生成语法树
  3. 预处理 → 验证权限与对象合法性
  4. 优化器选择最优执行计划
  5. 执行器执行 SQL 逻辑
  6. 存储引擎读取数据
  7. 返回结果集给客户端
http://www.lryc.cn/news/581568.html

相关文章:

  • 2025 JuniorCryptCTF re 部分wp
  • 重力翻转者:原创趣味小游戏
  • 前端开发常见问题(从布局到性能优化)
  • 【libm】 10 rem_pio2函数 (rem_pio2.rs)
  • 人工智能之数学基础:线性回归算法的矩阵参数求导
  • 传统微商困境与开源链动2+1模式、AI智能名片及S2B2C商城小程序的转型破局
  • AUTOSAR进阶图解==>AUTOSAR_SWS_V2XFacilities
  • Hadoop MapReduce 入门
  • Hadoop高可用集群搭建
  • k8s-服务发布基础
  • 小菜狗的云计算之旅,学习了解rsync+sersync实现数据实时同步(详细操作步骤)
  • 【Linux网络编程】Socket - UDP
  • 儿童趣味记忆配对游戏
  • 【CSS-15】深入理解CSS transition-duration:掌握过渡动画的时长控制
  • Java的各种各样的生命周期——思考历程
  • 字符函数和字符串函数(下)- 暴力匹配算法
  • ASP.NET Web Pages 安装使用教程
  • 随机森林算法详解:Bagging思想的代表算法
  • 【大模型入门】访问GPT_API实战案例
  • 8.2.1+8.2.2插入排序
  • 企业智脑:智能营销新纪元——自动化品牌建设与智能化营销的技术革命
  • 【Linux操作系统 | 第12篇】Linux磁盘分区
  • Dubbo 3.x源码(31)—Dubbo消息的编码解码
  • 我的LeetCode刷题指南:链表部分
  • 微服务基础:Spring Cloud Alibaba 组件有哪些?
  • 云原生 Serverless 架构下的智能弹性伸缩与成本优化实践
  • java easyExce 动态表头列数不固定
  • vue3 当前页面方法暴露
  • 0704-0706上海,又聚上了
  • 《前端路由重构:解锁多语言交互的底层逻辑》