当前位置: 首页 > news >正文

SQL关键字三分钟入门:ROW_NUMBER() —— 窗口函数为每一行编号

在进行数据分析时,我们常常需要为查询结果集中的每条记录生成一个唯一的序号或行号。例如:

  • 为每位员工按照入职时间排序并编号;
  • 按照订单金额对订单进行排序,并给每个订单分配一个顺序编号;
  • 在分组数据内为每条记录编号。

这时候就需要使用 SQL 中非常有用的窗口函数 —— ROW_NUMBER()

它可以帮助我们轻松地为查询结果集中的每一行分配一个独一无二的行号,特别适合处理涉及排序和分组的数据分析任务。


 什么是 ROW_NUMBER()?

ROW_NUMBER() 是 SQL 中用于为分区或整个结果集中的行生成唯一行号的窗口函数。它会根据指定的排序规则为每条记录分配一个连续的行号,即使存在相同的值也不会导致行号跳过。

你可以把它理解为:“按照某个标准给每条记录打上独一无二的行号标签”。


 基本语法

SELECT column1, column2, ..., 
ROW_NUMBER() OVER ([PARTITION BY partition_column]ORDER BY sort_column [ASC|DESC], ...
) AS row_num
FROM table_name;
  • PARTITION BY(可选):定义如何将数据划分为不同的分区(类似于 GROUP BY),每个分区独立进行编号。
  • ORDER BY:指定用于决定行号顺序的列及其方向(升序或降序)。

 示例讲解

假设我们有一个 employees 表,记录了员工的信息:

employee_idnamehire_date
1张三2020-06-01
2李四2019-05-23
3王五2021-07-15
4赵六2020-08-10
5孙七2018-03-12

 示例1:按入职日期为所有员工编号

SELECT name, hire_date,
ROW_NUMBER() OVER (ORDER BY hire_date ASC) AS row_num
FROM employees;
结果:
namehire_daterow_num
孙七2018-03-121
李四2019-05-232
张三2020-06-013
赵六2020-08-104
王五2021-07-155

 注意:这里我们按入职日期进行了升序排列,并为每位员工分配了一个连续的行号。


 示例2:按部门对员工进行编号(使用 PARTITION BY)

假设我们增加了一个 department 列来表示员工所属的部门:

employee_idnamedepartmenthire_date
1张三销售部2020-06-01
2李四销售部2019-05-23
3王五技术部2021-07-15
4赵六技术部2020-08-10
5孙七销售部2018-03-12
SELECT name, department, hire_date,
ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num
FROM employees;
结果:
namedepartmenthire_daterow_num
孙七销售部2018-03-121
李四销售部2019-05-232
张三销售部2020-06-013
王五技术部2021-07-151
赵六技术部2020-08-102

 这里我们按部门进行了划分,然后在每个部门内部根据入职日期进行编号。


 示例3:结合其他聚合函数使用

有时候你可能还需要同时计算一些汇总信息,比如总人数、平均入职年限等。下面的例子展示了如何同时显示编号和部门总人数:

SELECT name, department, hire_date,
ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num,
COUNT(*) OVER (PARTITION BY department) AS total_employees_in_dept
FROM employees;
结果:
namedepartmenthire_daterow_numtotal_employees_in_dept
孙七销售部2018-03-1213
李四销售部2019-05-2323
张三销售部2020-06-0133
王五技术部2021-07-1512
赵六技术部2020-08-1022

注意

对比项使用建议
唯一行号即使有相同的排序值,ROW_NUMBER() 也会为每条记录分配一个唯一的行号
不同的排名函数RANK():允许并列排名,但会导致行号跳跃
DENSE_RANK():与 RANK() 类似,但不会跳过行号
性能优化尽量减少 PARTITION BY 的范围以提高性能
数据一致性在执行复杂的编号操作时,确保数据的一致性和准确性

 总结对比表

场景SQL 示例
按单一条件编号SELECT ..., ROW_NUMBER() OVER (ORDER BY hire_date ASC) AS row_num FROM employees;
按部门内条件编号SELECT ..., ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num FROM employees;
结合其他聚合函数使用SELECT ..., ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num, COUNT(*) OVER (PARTITION BY department) AS total_employees_in_dept FROM employees;

希望这篇简短的指南帮助你快速了解了 ROW_NUMBER() 窗口函数的强大功能。

http://www.lryc.cn/news/576629.html

相关文章:

  • 力扣 刷题(第七十一天)
  • 车载诊断架构 --- 非易失性存储器(NVM)相关设置项
  • 电子电气架构 --- 车辆产品的生产周期和研发周
  • vue-29(创建 Nuxt.js 项目)
  • EXISTS 和 NOT EXISTS 、IN (和 NOT IN)
  • 基于Spring Boot的网上购物平台设计与实现
  • 星际争霸数据集指南
  • 桌面小屏幕实战课程:DesktopScreen 16 HTTP
  • MySQL 索引 -- 磁盘,主键索引,唯一索引,普通索引,全文索引
  • TDengine 如何使用 MQTT 采集数据?
  • PyQtNode Editor 第三篇创建节点(节点的定义)
  • 【图像处理基石】什么是摄影的数码味?
  • 基于Docker的mosquitto安装测试
  • 如何用VS Code、Sublime Text开发51单片机
  • python打卡day45
  • 顺序表的常见算法
  • FPGA设计的时序分析概要
  • 鸿蒙 Grid 与 GridItem 深度解析:二维网格布局解决方案
  • 【 Linux 输入子系统】
  • python的医疗废弃物收运管理系统
  • 【力扣 中等 C】79. 单词搜索
  • Webpack 核心与基础使用
  • 数据结构之——顺序栈与链式栈
  • 个人日记本小程序开发方案(使用IntelliJ IDEA)
  • ORB-SLAM + D435i提取相机位姿 + ROS发布
  • 现代串口通讯UI框架性能对比
  • 容器安全——AI教你学Docker
  • 机器学习——线性回归
  • 【数据标注师】3D标注
  • 使用Calibre对GDS进行数据遍历