当前位置：首页 > news >正文

一条 SQL 语句的内部执行流程详解（MySQL为例）

news 2025/7/7 8:41:26

当执行如下 SQL：

SELECT * FROM users WHERE id = 1;

在数据库内部，其实会经历多个复杂且有序的阶段。以下是 MySQL（InnoDB 引擎）中 SQL 查询语句从发送到结果返回的完整执行流程。

客户端连接阶段

客户端（如 JDBC、MySQL Shell）通过 TCP 与 MySQL 服务器建立连接。
连接器模块完成身份认证（用户名/密码）、权限校验。
若使用连接池，连接可能已被复用。

语法分析阶段（Parser）

1. 词法分析（Lexical Analysis）

将 SQL 字符串拆解成关键字、标识符、操作符等 Token。
例子：SELECT, *, FROM, users, WHERE, id, =, 1

2. 语法分析（Syntax Analysis）

依据 SQL 语法规则生成抽象语法树（AST）。
若语法不合法，此阶段抛出语法错误。

预处理阶段（Preprocessor）

验证表/字段是否存在。
检查当前用户是否有访问权限。
解析字段别名、函数等表达式。
确定查询涉及的表和列。
最终输出逻辑查询结构。

查询优化阶段（Optimizer）

优化器根据预处理阶段的语义结构生成最优执行计划（Execution Plan）。

1. 访问路径选择

使用 索引扫描 还是 全表扫描？
是否走覆盖索引，是否需要回表？

2. 连接顺序优化（Join Order）

对多表 JOIN，决定访问顺序与连接方法（如 Nested Loop、Hash Join）。

3. 成本估算（Cost Estimation）

评估每种执行方式的代价（IO 次数、内存使用等）。
选择代价最小的执行路径。

查询执行阶段（Executor）

执行器根据优化器生成的执行计划与存储引擎交互，完成数据访问。

执行器主要职责：

调用引擎接口访问表和索引。
进行 WHERE 过滤、JOIN、聚合、排序、分组等操作。
构造并返回最终结果集。

存储引擎访问阶段（以 InnoDB 为例）

MySQL 使用插件式存储引擎架构。以 InnoDB 为例：

数据页首先尝试从 Buffer Pool（缓冲池）中读取。
若不在缓冲池，则从磁盘读取并加入缓冲池。
使用 B+ 树索引定位记录。
如果为覆盖索引（索引包含查询列），可避免回表。
对于非索引字段，需根据主键“回表”查找。

结果返回阶段

执行器生成的结果集通过 MySQL 协议格式化。
数据从服务器通过网络传输返回给客户端。
客户端解析并展示结果。

日志与事务支持（InnoDB）

虽然 SELECT 查询本身不会写入日志，但其他 SQL 会涉及以下机制：

Undo Log：支持事务回滚、MVCC。
Redo Log：保证事务持久化（WAL机制）。
Binlog：记录变更操作，用于主从复制和恢复。

注：查询语句可能间接使用 undo log（如 MVCC）。

SQL 执行流程图

使用 EXPLAIN 查看执行计划

EXPLAIN SELECT * FROM users WHERE id = 1;

查看字段含义：

id: 查询标识
select_type: 查询类型（SIMPLE/PRIMARY等）
table: 访问的表
type: 连接类型（ALL、index、range、ref、const 等）
key: 使用的索引
rows: 扫描的行数
Extra: 是否使用临时表、排序、是否回表等信息

查询性能影响因素

影响因素	说明
是否走索引	非索引字段将触发全表扫描
是否回表	二级索引查询非索引字段时需根据主键回表
连接数与并发	并发高时，CPU/IO/锁资源紧张
查询缓存	MySQL 8.0 起已废弃
临时表与排序	ORDER BY / GROUP BY 可能触发文件排序与临时表
网络延迟	大结果集网络传输慢

总结

一条 SQL 查询的完整内部执行流程如下：

客户端连接 → 建立连接并认证
解析 SQL → 词法/语法分析生成语法树
预处理 → 验证权限与对象合法性
优化器选择最优执行计划
执行器执行 SQL 逻辑
存储引擎读取数据
返回结果集给客户端

http://www.lryc.cn/news/581568.html

相关文章：

2025 JuniorCryptCTF re 部分wp

重力翻转者：原创趣味小游戏

前端开发常见问题（从布局到性能优化）

【libm】 10 rem_pio2函数 (rem_pio2.rs)

人工智能之数学基础:线性回归算法的矩阵参数求导

传统微商困境与开源链动2+1模式、AI智能名片及S2B2C商城小程序的转型破局

AUTOSAR进阶图解==＞AUTOSAR_SWS_V2XFacilities

Hadoop MapReduce 入门

Hadoop高可用集群搭建

k8s-服务发布基础

小菜狗的云计算之旅，学习了解rsync+sersync实现数据实时同步（详细操作步骤）

【Linux网络编程】Socket - UDP

儿童趣味记忆配对游戏

【CSS-15】深入理解CSS transition-duration：掌握过渡动画的时长控制

Java的各种各样的生命周期——思考历程

字符函数和字符串函数（下）- 暴力匹配算法

ASP.NET Web Pages 安装使用教程

随机森林算法详解：Bagging思想的代表算法

【大模型入门】访问GPT_API实战案例

8.2.1+8.2.2插入排序

企业智脑：智能营销新纪元——自动化品牌建设与智能化营销的技术革命

【Linux操作系统 | 第12篇】Linux磁盘分区

Dubbo 3.x源码(31)—Dubbo消息的编码解码

我的LeetCode刷题指南：链表部分

微服务基础：Spring Cloud Alibaba 组件有哪些？

云原生 Serverless 架构下的智能弹性伸缩与成本优化实践

java easyExce 动态表头列数不固定

vue3 当前页面方法暴露

0704-0706上海，又聚上了

《前端路由重构：解锁多语言交互的底层逻辑》