SQL聚合函数用于对一组值执行计算并返回单一值,常见的聚合函数包括sum、count、avg、max、min等。在实际业务查询中,我们往往需要在聚合过程中加入条件判断,只统计符合特定条件的数据,这种用法就是条件聚合。

条件聚合的核心实现逻辑
条件聚合的核心是将case_when表达式作为聚合函数的参数,先通过case_when对每一行数据做条件判断,返回符合条件的值或者null,再让聚合函数对返回结果做计算。因为大部分聚合函数会忽略null值,所以就能实现只统计符合条件数据的效果。
基础语法结构
以sum函数结合条件聚合为例,基础语法如下:
-- 统计符合条件的数值总和 SUM(CASE WHEN 条件表达式 THEN 目标字段 ELSE NULL END)
如果是count函数做条件聚合,也可以将else部分写成0,不过因为count会统计非null值,所以两种写法效果一致:
-- 两种count条件聚合写法等效 COUNT(CASE WHEN 条件表达式 THEN 1 ELSE NULL END) COUNT(CASE WHEN 条件表达式 THEN 1 ELSE 0 END)
常见场景实战示例
假设我们有一张订单表order_info,表结构如下:
| 字段名 | 类型 | 说明 |
|---|---|---|
| order_id | int | 订单ID |
| user_id | int | 用户ID |
| order_amount | decimal | 订单金额 |
| order_status | varchar | 订单状态,已支付/未支付/已取消 |
| create_time | datetime | 下单时间 |
场景1:按用户统计不同状态的订单数量
需求是统计每个用户的已支付订单数、未支付订单数和已取消订单数,就可以用条件聚合实现:
SELECT
user_id,
-- 统计已支付订单数
COUNT(CASE WHEN order_status = '已支付' THEN 1 ELSE NULL END) AS paid_order_count,
-- 统计未支付订单数
COUNT(CASE WHEN order_status = '未支付' THEN 1 ELSE NULL END) AS unpaid_order_count,
-- 统计已取消订单数
COUNT(CASE WHEN order_status = '已取消' THEN 1 ELSE NULL END) AS canceled_order_count
FROM order_info
GROUP BY user_id;
场景2:统计不同金额区间的订单总金额
需求是统计每个用户订单金额小于100元的总金额、100到500元的总金额、大于500元的总金额:
SELECT
user_id,
-- 小于100元的订单总金额
SUM(CASE WHEN order_amount < 100 THEN order_amount ELSE NULL END) AS low_amount_sum,
-- 100到500元的订单总金额
SUM(CASE WHEN order_amount >= 100 AND order_amount <= 500 THEN order_amount ELSE NULL END) AS mid_amount_sum,
-- 大于500元的订单总金额
SUM(CASE WHEN order_amount > 500 THEN order_amount ELSE NULL END) AS high_amount_sum
FROM order_info
GROUP BY user_id;
场景3:结合时间条件做聚合
需求是统计每个用户本月订单总金额和上月订单总金额,这里需要结合时间条件判断:
SELECT
user_id,
-- 本月订单总金额,假设当前月份是2024年5月
SUM(CASE WHEN DATE_FORMAT(create_time, '%Y-%m') = '2024-05' THEN order_amount ELSE NULL END) AS current_month_amount,
-- 上月订单总金额
SUM(CASE WHEN DATE_FORMAT(create_time, '%Y-%m') = '2024-04' THEN order_amount ELSE NULL END) AS last_month_amount
FROM order_info
GROUP BY user_id;
使用注意事项
case_when表达式的条件判断要覆盖所有需要的情况,避免出现逻辑遗漏导致统计结果错误。- 如果聚合函数是avg,需要注意null值不会影响平均值计算,但是如果写成else 0的话,会把不符合条件的行算入分母,导致平均值结果错误,所以avg条件聚合建议else部分写null。
- 条件聚合可以和
group_by、having等子句正常配合使用,先完成条件聚合计算后,再用having对聚合结果做过滤。
条件聚合是SQL查询中非常实用的技巧,能够在一个查询语句中完成多维度、多条件的分类统计,减少多次查询带来的性能开销,熟练掌握后可以大幅提升复杂统计需求的实现效率。