在SQL的实际业务处理中,我们经常遇到需要计算累积求和的需求,比如统计用户累计消费金额、计算订单累计成交量等。如果还需要对求和的数据加上条件限制,比如只统计状态为已完成的订单金额,普通的SUM聚合函数就无法直接满足需求,这时候可以结合窗口函数和CASE表达式来实现。

实现原理说明
整个实现逻辑的核心分为两步,首先通过CASE表达式对数据进行条件筛选,将符合条件的数据保留原值,不符合条件的数据转为0,然后再使用窗口函数对处理后的结果做累积求和。
- CASE表达式的作用:根据设定的条件判断每一行数据是否需要参与求和,需要参与的行返回对应数值,不需要参与的行返回0,避免不符合条件的数据影响求和结果。
- 窗口函数的作用:指定累积求和的范围和顺序,常用的SUM窗口函数可以在不合并行的前提下,按照排序规则逐行累加前面的数值,得到每一行对应的累积求和结果。
基础实现示例
假设我们有一张订单表order_table,表结构如下:
| 字段名 | 类型 | 说明 |
|---|---|---|
| order_id | INT | 订单ID |
| user_id | INT | 用户ID |
| order_amount | DECIMAL | 订单金额 |
| order_status | VARCHAR | 订单状态,completed表示已完成 |
| create_time | DATETIME | 订单创建时间 |
现在需要计算每个用户已完成订单的累计金额,按订单创建时间排序,SQL实现代码如下:
-- 计算每个用户已完成订单的累积金额
SELECT
order_id,
user_id,
order_amount,
order_status,
create_time,
-- 先通过CASE筛选已完成的订单,再按用户分区、时间排序做累积求和
SUM(CASE WHEN order_status = 'completed' THEN order_amount ELSE 0 END)
OVER (PARTITION BY user_id ORDER BY create_time) AS cumulative_completed_amount
FROM order_table
ORDER BY user_id, create_time;
多条件筛选的累积求和示例
如果需要同时满足多个条件再做累积求和,比如统计金额大于100且状态为已完成的订单累积金额,只需要在CASE表达式中增加条件判断即可:
-- 多条件筛选的累积求和
SELECT
order_id,
user_id,
order_amount,
order_status,
create_time,
SUM(CASE WHEN order_status = 'completed' AND order_amount > 100 THEN order_amount ELSE 0 END)
OVER (PARTITION BY user_id ORDER BY create_time) AS cumulative_amount
FROM order_table
ORDER BY user_id, create_time;
不同数据库的适配说明
上述代码基于标准SQL语法,大部分支持窗口函数的数据库都可以直接使用,部分数据库有细微差异:
- MySQL 8.0及以上版本、PostgreSQL、SQL Server、Oracle都支持这种写法,无需额外调整。
- 如果是MySQL 5.7及以下版本,不支持窗口函数,可以通过用户变量来实现类似效果,示例代码如下:
-- MySQL 5.7及以下版本实现带条件累积求和
SET @cumulative := 0;
SET @current_user := NULL;
SELECT
order_id,
user_id,
order_amount,
order_status,
create_time,
@cumulative := CASE
WHEN @current_user = user_id THEN
@cumulative + CASE WHEN order_status = 'completed' THEN order_amount ELSE 0 END
ELSE
CASE WHEN order_status = 'completed' THEN order_amount ELSE 0 END
END AS cumulative_completed_amount,
@current_user := user_id
FROM order_table
ORDER BY user_id, create_time;
注意事项
- 窗口函数中的ORDER BY子句非常重要,决定了累积求和的顺序,如果不需要排序可以省略,但累积求和通常需要按时间或ID排序,避免结果不符合预期。
- CASE表达式中ELSE部分要设置为0,而不是NULL,因为SUM函数计算时会忽略NULL,如果符合条件的数据后面出现不符合条件的行,NULL会导致累积结果中断。
- PARTITION BY子句用于按指定字段分组计算,如果需要对全表做统一的累积求和,可以省略PARTITION BY部分。
使用窗口函数结合CASE实现带条件累积求和的方式,既灵活又高效,不需要多次关联表或者使用复杂的子查询,在大数据量场景下性能也更有优势。