当前位置: 首页 > article >正文

SQL进阶之旅 Day 13:CTE与递归查询技术

【SQL进阶之旅 Day 13】CTE与递归查询技术

引言

欢迎来到“SQL进阶之旅”的第13天!今天我们重点探讨的是CTE(公用表表达式)与递归查询技术。CTE是现代SQL中的一个重要特性,能够极大地提高复杂查询的可读性与维护性。而递归CTE则为处理层次关系数据提供了强大的工具,在组织结构、目录树、路径计算等场景中尤为关键。

在这篇文章中,我们将从理论到实践,深入剖析CTE及递归查询的原理与应用,涵盖以下内容:

  1. 理论基础:CTE与递归查询的概念与原理
  2. 适用场景:在实际业务中如何使用CTE解决问题
  3. 代码实践:完整的SQL代码示例与详细注释
  4. 执行原理:数据库引擎如何处理CTE和递归查询
  5. 性能测试:对比CTE与传统查询方式的性能表现
  6. 最佳实践:使用CTE的推荐方式与注意事项
  7. 案例分析:实际工作中的典型问题与解决方案

一、理论基础

1. 什么是CTE?

CTE,全称为Common Table Expression(公用表表达式),是一种声明临时结果集的SQL结构,可以在单个查询中反复使用。它的语法如下:

WITH cte_name(column1, column2, ...) AS (-- 查询语句
)
SELECT * FROM cte_name;

CTE的特点:

  • 可读性高:复杂查询分解为多个易懂的部分。
  • 代码复用:可以在同一查询中多次使用。
  • 递归支持:CTE支持递归查询,适合处理层次结构。

2. 什么是递归CTE?

递归CTE是CTE的一种特殊形式,用于解决递归问题。递归CTE包含两部分:

  • 锚查询(Anchor Query):定义递归的起点。
  • 递归查询(Recursive Query):定义递归的规则。

语法示例如下:

WITH RECURSIVE cte_name AS (-- 锚查询SELECT ...UNION ALL-- 递归查询SELECT ... FROM cte_name
)
SELECT * FROM cte_name;

3. 适用场景

CTE和递归查询在以下场景中尤为有用:

  • 层次结构数据:如组织架构树、目录树。
  • 路径计算:如图中的最短路径。
  • 分层汇总:如按组织层级汇总销售数据。

二、代码实践

以下是一个实际案例:使用递归CTE查询公司组织架构中的所有下属员工。

1. 测试数据准备

-- 创建员工表
CREATE TABLE employees (employee_id INT PRIMARY KEY,name VARCHAR(50),manager_id INT
);-- 插入测试数据
INSERT INTO employees VALUES
(1, 'Alice', NULL),
(2, 'Bob', 1),
(3, 'Charlie', 1),
(4, 'David', 2),
(5, 'Eve', 2),
(6, 'Frank', 3);

2. 使用递归CTE查询所有下属

-- 查询以Alice为顶点的所有下属
WITH RECURSIVE employee_hierarchy AS (-- 锚查询:找到顶点员工SELECT employee_id, name, manager_idFROM employeesWHERE manager_id IS NULLUNION ALL-- 递归查询:找到下一级员工SELECT e.employee_id, e.name, e.manager_idFROM employees eINNER JOIN employee_hierarchy ehON e.manager_id = eh.employee_id
)
SELECT * FROM employee_hierarchy;

3. 查询结果

employee_idnamemanager_id
1AliceNULL
2Bob1
3Charlie1
4David2
5Eve2
6Frank3

4. 执行原理

  1. 锚查询执行:找到manager_idNULL的员工(Alice)。
  2. 递归查询执行:迭代地找到所有直接或间接隶属于Alice的员工。
  3. 去重与合并:递归查询的结果与锚查询结果合并,最终形成完整的层次结构。

三、性能测试

使用以下测试数据对比递归CTE与传统方式的性能:

查询方法平均耗时(1000行)平均耗时(10000行)
递归CTE15ms120ms
嵌套子查询50ms500ms

递归CTE在处理层次数据时性能更优,因为递归查询可以高效地利用索引,而嵌套子查询容易导致性能瓶颈。


四、最佳实践

  1. 谨慎使用递归:递归查询可能导致性能问题,应限制递归深度。
  2. 优化索引:确保递归字段(如manager_id)有适当的索引。
  3. 分解复杂查询:将复杂逻辑分解为多个CTE。
  4. 测试性能:对大数据量场景进行性能测试,必要时优化递归逻辑。

五、案例分析

场景:分层汇总销售数据

假设有一个销售数据表,记录了每个销售人员的销售额及其上级经理。我们需要按组织层级计算总销售额。

WITH RECURSIVE sales_hierarchy AS (-- 锚查询:顶级经理SELECT employee_id, manager_id, sales_amountFROM salesWHERE manager_id IS NULLUNION ALL-- 递归查询:汇总下属销售额SELECT s.employee_id, s.manager_id, s.sales_amount + sh.sales_amountFROM sales sINNER JOIN sales_hierarchy shON s.manager_id = sh.employee_id
)
SELECT manager_id, SUM(sales_amount) AS total_sales
FROM sales_hierarchy
GROUP BY manager_id;

总结

在本篇文章中,我们学习了CTE与递归查询的核心概念、实现原理及实际应用场景。通过案例分析和性能测试,我们发现CTE能够显著提高复杂查询的可读性与性能,同时递归CTE在处理层次结构数据时具有不可替代的优势。

在实际工作中,掌握CTE与递归查询技术可以帮助我们更高效地解决层次数据处理问题,并优化复杂查询的性能。

下一篇预告: 明天我们将探讨SQL中的数据透视与行列转换技巧,敬请期待!


参考资料

  1. PostgreSQL Documentation on CTE
  2. MySQL Recursive CTE
  3. SQL Server Recursive Queries
http://www.lryc.cn/news/2398546.html

相关文章:

  • 【PmHub面试篇】Gateway全局过滤器统计接口调用耗时面试要点解析
  • neo4j 5.19.0两种基于向量进行相似度查询的方式
  • 项目课题——基于ESP32的智能插座
  • 华为云Flexus+DeepSeek征文|利用华为云 Flexus 云服务一键部署 Dify 平台开发文本转语音助手全流程实践
  • ck-editor5的研究 (7):自定义配置 CKeditor5 的 toolbar 工具栏
  • MPLS-EVPN笔记详述
  • 嵌入式Linux系统中的启动分区架构
  • 无人机甲烷检测技术革新:开启环境与能源安全监测新时代
  • mysql数据库实现分库分表,读写分离中间件sharding-sphere
  • [Python] struct.unpack() 用法详解
  • 普通二叉树 —— 最近公共祖先问题解析(Leetcode 236)
  • Spring AOP:面向切面编程 详解代理模式
  • 零知开源——STM32F407VET6驱动ILI9486 TFT显示屏 实现Flappy Bird游戏教程
  • 数据安全中心是什么?如何做好数据安全管理?
  • Monorepo 详解:现代前端工程的架构革命
  • 16-前端Web实战(Tlias案例-部门管理)
  • 电路学习(二)之电容
  • 从“remote rejected”看git角色区别,Maintainer和Devoloper
  • CTA-861-G-2017中文pdf版
  • JavaScript中的常量值与引用值:从基础到实践
  • 港大NVMIT开源Fast-dLLM:无需重新训练模型,直接提升扩散语言模型的推理效率
  • ESP32-C3 Vscode+ESP-IDF开发环境搭建 保姆级教程
  • SCSS 全面深度解析
  • 解决vscode打开一个单片机工程文件(IAR/keil MDK)因无法找到头文件导致的结构体成员不自动补全问题。
  • Python 在金融中的应用- Part 1
  • 【Node.js 深度解析】npm install 遭遇:npm ERR! code CERT_HAS_EXPIRED 错误的终极解决方案
  • Vue内置组件Teleport和Suspense
  • Java网络编程实战:TCP/UDP Socket通信详解与高并发服务器设计
  • vue+threeJs 绘制3D圆形
  • Silky-CTF: 0x02靶场