当前位置: 首页 > news >正文

SQL偏移类窗口函数—— LAG()、LEAD()用法详解

SQL偏移类窗口函数:LAG()LEAD() 用法详解

在这里插入图片描述

在 SQL 中,偏移类窗口函数 LAG()LEAD() 用于访问当前行的前几行或后几行的值。

1. LAG() 函数

在这里插入图片描述

LAG() 函数返回当前行的前几行的数据。

LAG(Expression, OffSetValue, DefaultVar) OVER (PARTITION BY [Expression]ORDER BY Expression [ASC|DESC]
);
  • expression🍔: 你想要获取的列或表达式。
  • offset🍟 (可选): 你希望向前偏移的行数。默认是 1,表示获取前一行的数据。
  • default_value🍿 (可选): 如果当前行之前没有足够的行,返回的默认值。默认是 NULL,如果没有设置 default_value,且当前行是窗口的第一行或没有前几行数据时,返回 NULL
  • PARTITION BY🥓 (可选): 按某列分组计算窗口函数,类似于 GROUP BY。如果没有此项,整个数据集视为一个窗口。
  • ORDER BY🥩: 按照某列排序,确定偏移的顺序。

Demo🍕🍕🍕🍕🍕🍕:

表格数据😎

sales 表,表结构和数据如下:

idmonthrevenue
1Jan100
2Feb150
3Mar200

Demo🍕🍕:基础用法

使用 LAG() 函数来获取按月排序后的“revenue”列的前一行的值

SELECT  id, month, revenue, LAG(revenue) OVER (ORDER BY month) AS prev_revenue
FROM sales;
idmonthrevenueprev_revenue
1Jan100NULL
2Feb150100
3Mar200150

Tips🍬🍬:

  • 第一行没有前一行,所以 prev_revenueNULL
  • 第二行的 prev_revenue 为第一行的 revenue 值(100)。
  • 第三行的 prev_revenue 为第二行的 revenue 值(150)。

Demo🍕🍕:带偏移量的 LAG() 函数

使用 LAG() 函数,并指定偏移量为 2,获取两行之前的“revenue”值。

SELECT  id, month, revenue, LAG(revenue, 2) OVER (ORDER BY month) AS prev_revenue
FROM sales;
idmonthrevenueprev_revenue
1Jan100NULL
2Feb150NULL
3Mar200100

Tips🍬🍬:

  • 第一行和第二行都没有两行之前的记录,所以 prev_revenueNULL
  • 第三行的 prev_revenue 为第一行的 revenue 值(100)。

Demo🍕🍕:带默认值的 LAG() 函数

使用 LAG() 函数,并指定默认值为 0,当无法获取前一行的值时返回默认值。

SELECT  id, month, revenue, LAG(revenue, 1, 0) OVER (ORDER BY month) AS prev_revenue
FROM sales;
idmonthrevenueprev_revenue
1Jan1000
2Feb150100
3Mar200150

Tips🍬🍬:

  • 使用 LAG(revenue, 1, 0) 来获取前一行的“revenue”值,如果没有前一行则返回默认值 0
  • 第一行没有前一行,所以 prev_revenue0
  • 第二行的 prev_revenue 为第一行的 revenue 值(100)。
  • 第三行的 prev_revenue 为第二行的 revenue 值(150)。

Demo🍕🍕: LAG() 函数,比较每一天的销售额与前一天的销售额的差异。

SELECTsale_date,amount,LAG(amount, 1, 0) OVER (ORDER BY sale_date) AS previous_day_amount,amount - LAG(amount, 1, 0) OVER (ORDER BY sale_date) AS difference
FROM sales;
  • LAG(amount, 1, 0):这行的 LAG 函数表示获取前一天(前一行)的 amount 列的值,如果前一天没有数据(例如第一行),则返回 0
  • 通过 ORDER BY sale_date,确保按日期顺序排列数据。
sale_dateamountprevious_day_amountdifference
2025-01-011000100
2025-01-0215010050
2025-01-0320015050
2025-01-04180200-20

2. LEAD() 函数

在这里插入图片描述

LEAD() 函数与 LAG() 类似,但它返回的是当前行的后几行的数据。

LEAD(Expression, OffSetValue, DefaultVar) OVER (PARTITION BY [Expression]ORDER BY Expression [ASC|DESC]
);

  • expression🍔: 你想要获取的列或表达式。
  • offset🍟 (可选): 你希望向前偏移的行数。默认是 1,表示获取前一行的数据。
  • default_value🍿 (可选): 如果当前行之前没有足够的行,返回的默认值。默认是 NULL,如果没有设置 default_value,且当前行是窗口的第一行或没有前几行数据时,返回 NULL
  • PARTITION BY🥓 (可选): 按某列分组计算窗口函数,类似于 GROUP BY。如果没有此项,整个数据集视为一个窗口。
  • ORDER BY🥩: 按照某列排序,确定偏移的顺序。

Demo🍕🍕:基础用法

使用 LEAD() 函数来获取按月排序后的“revenue”列的后一行的值。

SELECT  id, month, revenue, LEAD(revenue) OVER (ORDER BY month) AS next_revenue
FROM sales;
idmonthrevenuenext_revenue
1Jan100150
2Feb150200
3Mar200NULL

Tips🍬🍬:

  • 第一行的 next_revenue 为第二行的 revenue 值(150)。
  • 第二行的 next_revenue 为第三行的 revenue 值(200)。
  • 第三行没有后续行,所以 next_revenueNULL

Demo🍕🍕:带偏移量的 LEAD() 函数

使用 LEAD() 函数,并指定偏移量为 2,获取两行之后的“revenue”值。

SELECT  id, month,revenue, LEAD(revenue, 2) OVER (ORDER BY month) AS next_revenue
FROM sales;
idmonthrevenuenext_revenue
1Jan100200
2Feb150NULL
3Mar200NULL

Tips🍬🍬:

  • 使用 LEAD(revenue, 2) 来获取两行之后的“revenue”值。
  • 第一行的 next_revenue 为第三行的 revenue 值(200)。
  • 第二行和第三行都没有两行之后的记录,所以 next_revenueNULL

Demo🍕🍕:带默认值的 LEAD() 函数

使用 LEAD() 函数,并指定默认值为 0,当无法获取后一行的值时返回默认值。

SELECT id, month, revenue, LEAD(revenue, 1, 0) OVER (ORDER BY month) AS next_revenue
FROM sales;
idmonthrevenuenext_revenue
1Jan100150
2Feb150200
3Mar2000

Tips🍬🍬:

  • 使用 LEAD(revenue, 1, 0) 来获取后一行的“revenue”值,如果没有后一行则返回默认值 0
  • 第一行的 next_revenue 为第二行的 revenue 值(150)。
  • 第二行的 next_revenue 为第三行的 revenue 值(200)。
  • 第三行没有后一行,所以 next_revenue0

Demo🍕🍕:LEAD() 函数,比较每一天的销售额与下一天的销售额的差异。

SELECTsale_date,amount,LEAD(amount, 1, 0) OVER (ORDER BY sale_date) AS next_day_amount,LEAD(amount, 1, 0) OVER (ORDER BY sale_date) - amount AS difference
FROM sales;
  • LEAD(amount, 1, 0):这行的 LEAD 函数表示获取下一天(下一行)的 amount 列的值。如果下一天没有数据(例如最后一行),则返回 0
  • 通过 ORDER BY sale_date,确保按日期顺序排列数据。
sale_dateamountnext_day_amountdifference
2025-01-0110015050
2025-01-0215020050
2025-01-03200180-20
2025-01-041800-180

最后再来一个小练习(lc会员题):查找电影院所有连续可用的座位。

在这里插入图片描述
在这里插入图片描述

WITH t1 AS (SELECTseat_id,  -- 选择座位IDfree,  -- 选择当前座位的空闲状态lag(free, 1, 999) OVER() AS pre,  -- 获取当前座位前一个座位的空闲状态,默认值为 999lead(free, 1, 999) OVER() AS next  -- 获取当前座位后一个座位的空闲状态,默认值为 999FROM Cinema  -- 从 Cinema 表中选择数据
)SELECTseat_id  -- 返回座位ID
FROM t1  -- 从 t1 子查询中选择数据
WHERE free = 1  -- 当前座位为空闲AND (pre = 1 OR next = 1)  -- 前一个座位或后一个座位为空闲
ORDER BY seat_id;  -- 按座位ID升序排序

思路:

  1. lag(free, 1, 999)lead(free, 1, 999):

    • lag(free, 1, 999) 用于获取当前座位前一个座位的 free 值(默认为 999,表示没有前一个座位)。
    • lead(free, 1, 999) 用于获取当前座位后一个座位的 free 值(默认为 999,表示没有后一个座位)。
  2. free = 1(pre = 1 OR next = 1):

    • 只选择当前座位是空闲的 (free = 1)。
    • 选择那些前一个或后一个座位也是空闲的 (pre = 1 OR next = 1),表示这些座位是连续空闲的。
  3. ORDER BY seat_id:

    • 确保最终返回的结果按座位 ID 升序排序。

seat_idfree
11
20
31
41
51

通过执行查询,得到的 t1 子查询结果:

seat_idfreeprenext
119990
2011
3101
4111
511999

t1 中筛选出满足 free = 1(pre = 1 OR next = 1) 的行,得到的结果:

seat_id
3
4
5

整理不易,一键三连呀列位🤣

http://www.lryc.cn/news/514481.html

相关文章:

  • 基于Pytorch和yolov8n手搓安全帽目标检测的全过程
  • [CTF/网络安全] 攻防世界 upload1 解题详析
  • 03-其他
  • EasyExcel自定义动态下拉框(附加业务对象转换功能)
  • 2025.1.2
  • 重庆大学软件工程复试怎么准备?
  • Ant Design Pro搭建react项目
  • mysql连接时报错1130-Host ‘hostname‘ is not allowed to connect to this MySQL server
  • 办公 三之 Excel 数据限定录入与格式变换
  • Ubuntu执行sudo apt-get update失败的解决方法
  • torch.nn.functional的用法
  • 最新常见的图数据库对比,选型,架构,性能对比
  • UE5材质节点Camera Vector/Reflection Vector
  • NextCloud服务安装与配置教程
  • 详解GPT-信息抽取任务 (GPT-3 FAMILY LARGE LANGUAGE MODELS)
  • 华为数通考试模拟真题(附带答案解析)题库领取
  • 微信小程序:正确输出<小于,大于>符号
  • Flink源码解析之:如何根据算法生成StreamGraph过程
  • 矩阵简单问题(Java)
  • Elasticsearch DSL版
  • 2024-12-29-sklearn学习(26)模型选择与评估-交叉验证:评估估算器的表现 今夜偏知春气暖,虫声新透绿窗纱。
  • STM32CUBEIDE FreeRTOS操作教程(十二):std dynamic memory 标准动态内存
  • 异步爬虫之aiohttp的使用
  • 【Rust自学】9.1. 不可恢复的错误以及panic!
  • 【老张的程序人生】一天时间,我成软考高级系统分析师
  • vue使用el-select下拉框自定义复选框
  • k8s基础(2)—Kubernetes-Namespace
  • APM for Large Language Models
  • Spark Runtime Filter
  • AI大模型系列之七:Transformer架构讲解