LAG函数是SQL中常用的窗口函数之一,主要作用是在查询结果集中,针对当前行获取其前面指定偏移量的行数据,最常见的使用场景就是获取上一行数据。它不需要进行自连接操作,就能轻松实现行与行之间的数据对比,大幅简化查询逻辑。

LAG函数基本语法
LAG函数的标准语法结构如下:
LAG(expression [, offset [, default_value]]) OVER (
[PARTITION BY partition_expression]
ORDER BY sort_expression [ASC|DESC]
)
各参数含义说明:
- expression:要获取的字段表达式,也就是你需要从上一行拿的具体列或者计算值。
- offset:偏移量,默认值为1,表示获取当前行前1行的数据,设置为2就是获取前2行的数据,以此类推。
- default_value:可选参数,当偏移量对应的行不存在时,返回该默认值,不设置的话默认返回NULL。
- PARTITION BY:可选的分组子句,用于将结果集分成多个分区,LAG函数会在每个分区内独立计算偏移,不会跨分区取值。
- ORDER BY:必填的排序子句,指定分区内行的排序规则,LAG函数会根据这个排序来确定哪一行是上一行。
基础使用案例:获取上一行数据
假设我们有一张销售记录表sales_record,表结构如下:
| 字段名 | 类型 | 说明 |
|---|---|---|
| id | INT | 记录ID |
| product_name | VARCHAR | 产品名称 |
| sale_date | DATE | 销售日期 |
| sale_amount | DECIMAL | 销售金额 |
现在需要查询每个产品的销售记录,同时获取同一产品上一次的销售金额,方便计算两次销售的金额差值。查询语句如下:
SELECT
id,
product_name,
sale_date,
sale_amount,
-- 获取同一产品上一行的销售金额,没有上一行则返回0
LAG(sale_amount, 1, 0) OVER (
PARTITION BY product_name
ORDER BY sale_date ASC
) AS last_sale_amount
FROM sales_record
ORDER BY product_name, sale_date;
上述语句中,我们通过PARTITION BY product_name把数据按产品分组,每个产品单独计算上一行的销售金额,ORDER BY sale_date ASC保证按销售日期升序排列,这样上一行就是时间上更早的那条销售记录。如果某个产品的第一条记录没有上一行,就会返回我们设置的默认值0。
进阶使用:计算相邻行数据差值
基于上面的查询结果,我们可以进一步计算每个产品相邻两次销售的金额差值,语句如下:
SELECT
id,
product_name,
sale_date,
sale_amount,
last_sale_amount,
-- 计算当前销售额和上一行销售额的差值
sale_amount - last_sale_amount AS sale_diff
FROM (
SELECT
id,
product_name,
sale_date,
sale_amount,
LAG(sale_amount, 1, 0) OVER (
PARTITION BY product_name
ORDER BY sale_date ASC
) AS last_sale_amount
FROM sales_record
) AS temp
ORDER BY product_name, sale_date;
使用注意事项
- LAG函数属于窗口函数,大部分主流关系型数据库如MySQL 8.0+、PostgreSQL、SQL Server、Oracle都支持,低版本数据库可能无法使用,使用前需要确认数据库版本。
- OVER子句中的ORDER BY子句是必填的,如果没有指定排序规则,数据库无法确定行的先后顺序,LAG函数的结果会不符合预期。
- 如果设置了PARTITION BY分组,偏移计算只会在分组内进行,不会跨分组获取其他组的数据。
- 当偏移量超过当前分区的行数时,会返回设置的默认值,如果没有设置默认值则返回NULL,需要根据业务场景合理设置默认值。
需要注意的是,LAG函数是针对查询结果的行进行计算的,如果查询本身有过滤条件,会先过滤数据再执行LAG函数的计算,所以过滤条件会影响上一行数据的取值。