当前位置: 首页 > news >正文

高级SQL技巧详解与实例

在数据处理与分析领域,高级SQL技巧是提升效率与准确性的关键。本文将结合参考资料,对高级SQL技巧进行系统的整理与解读,并通过实例展示其应用。

一、窗口函数

窗口函数是一种在SQL中执行复杂计算的强大工具,它们允许用户在一组行(称为窗口)上执行计算,而不会将这些行合并成单个结果行。窗口函数在处理排名、累计和运行总和等场景中非常有用。

基本语法

<窗口函数> OVER([PARTITION BY <分区列>][ORDER BY <排序列>])

常见窗口函数

  1. ROW_NUMBER():为每一行分配一个唯一的序号。
  2. RANK():为每一行分配一个序号,但序号间可能有跳跃(如有两行数据相同,则它们共享同一序号,下一行的序号将跳过)。
  3. DENSE_RANK():为每一行分配一个序号,序号间无跳跃(即使两行数据相同,也会为下一行分配连续的序号)。
  4. LEAD()LAG():用于访问同一窗口中前一行或后一行的数据。

实例

SELECT employee_id, department_id, salary,ROW_NUMBER() OVER(PARTITION BY department_id ORDER BY salary DESC) AS row_num,RANK() OVER(PARTITION BY department_id ORDER BY salary DESC) AS rank,DENSE_RANK() OVER(PARTITION BY department_id ORDER BY salary DESC) AS dense_rank,LAG(salary, 1) OVER(PARTITION BY department_id ORDER BY salary DESC) AS previous_salary
FROM employees;
二、递归查询

递归查询允许用户在一个查询中多次引用同一个表,这在处理树形结构数据(如组织架构、目录结构)时非常有用。

基本语法

WITH RECURSIVE cte_name AS (初始查询UNION ALL递归查询
)
SELECT * FROM cte_name;

实例

WITH RECURSIVE EmployeeCTE AS (SELECT employee_id, manager_id, 1 AS levelFROM employeesWHERE manager_id IS NULLUNION ALLSELECT e.employee_id, e.manager_id, ecte.level + 1FROM employees eINNER JOIN EmployeeCTE ecte ON e.manager_id = ecte.employee_id
)
SELECT employee_id, employee_name, level
FROM EmployeeCTE
ORDER BY level, employee_id;
三、公共表表达式(CTEs)

CTE是一种临时的结果集,只在单个查询的执行周期内有效。它有助于使复杂查询更加易读和易维护。

基本语法

WITH cte_name AS (查询语句
)
SELECT * FROM cte_name;

实例

WITH SalesCTE AS (SELECT employee_id, SUM(amount) AS total_salesFROM salesGROUP BY employee_id
)
SELECT employee_id, total_sales
FROM SalesCTE
WHERE total_sales > 10000;
四、子查询

子查询是嵌套在另一个查询中的查询,常用于筛选条件和数据过滤。

实例

SELECT employee_id, salary
FROM employees
WHERE salary > (SELECT AVG(salary) FROM employees);
五、集合操作

集合操作允许用户将两个或多个查询结果集进行合并或比较。常见的集合操作符包括UNION、INTERSECT和EXCEPT。

实例

-- 合并两个查询结果集
SELECT name FROM customers
UNION
SELECT name FROM suppliers;-- 找出两个查询结果集的交集
SELECT name FROM customers
INTERSECT
SELECT name FROM suppliers;-- 找出只在第一个查询结果集中存在的记录
SELECT name FROM customers
EXCEPT
SELECT name FROM suppliers;
六、其他高级技巧
  1. 临时函数:在支持的数据库中(如PostgreSQL),可以定义临时函数来封装复杂的逻辑,增强代码重用性。
  2. 日期时间操作:包括日期加减、日期格式转换等。
  3. 索引优化:创建适当的索引可以显著提高查询性能。
  4. 自联结:一个表与自身进行联结,常用于处理相对数据。
  5. 分页:使用LIMIT子句进行分页查询,减少大偏移量
http://www.lryc.cn/news/472235.html

相关文章:

  • 实现PC端和安卓手机的局域网内文件共享
  • 腾讯云云开发深度解读:云数据库、云模板与AI生成引用的魅力
  • 预览 PDF 文档
  • Chromium 在WebContents中添加自定义数据c++
  • 【Apache Zookeeper】
  • 13.音乐管理系统(基于SpringBoot + Vue)
  • 如何从iconfont中获取字体图标并应用到微信小程序中去?
  • C语言中的位操作
  • Spring之HTTP客户端--RestTemplate的使用
  • vscode和pycharm在当前工作目录的不同|python获取当前文件目录和当前工作目录
  • 速盾:海外高防CDN有哪些优势?
  • OpenCV视觉分析之目标跟踪(4)目标跟踪类TrackerDaSiamRPN的使用
  • 自动对焦爬山算法原理
  • Hyperledger Fabric有那些核心技术,和其他区块链对比Hyperledger Fabric有那些优势
  • 「Mac畅玩鸿蒙与硬件8」鸿蒙开发环境配置篇8 - 应用依赖与资源管理
  • 【Gorm】传统sql的增删查改,通过go去操作sql
  • HTML小阶段二维表和思维导图
  • AI与低代码的碰撞:企业数字化转型的新引擎
  • HarmonyOS应用开发者基础认证——初级闯关习题参考答案大全
  • Vue背景图片自适应大屏与小屏
  • MongoDB 8.0.3版本安装教程
  • 【C语言】预处理(预编译)详解(下)(C语言最终篇)
  • [Linux] linux 软硬链接与动静态库
  • GitHub Actions的 CI/CD
  • doris 表结构批量导出
  • linux查看文件命令
  • 【2023工业图像异常检测文献】DiAD: 基于扩散模型的多类异常检测方法
  • 三相继电保护机 继电器保护校验仪 微机继电保护测试仪
  • MyEclipse中讲解Git使用——结合GitLab
  • pdf转为txt文本格式并使用base64加密输出数据