在SQL查询场景中,我们经常需要先对数据做分组统计,再筛选出符合特定统计条件的分组结果,这时候having子句结合聚合函数就能发挥重要作用。它和where子句的作用场景不同,专门针对分组后的聚合结果做过滤,是SQL分组查询中不可或缺的一部分。
having子句的基本作用
having子句通常与group_by子句搭配使用,作用是对group_by分组后的结果集进行条件筛选。和where子句直接筛选原始数据行不同,having子句筛选的是分组后的聚合结果,所以条件中经常会包含聚合函数的计算结果。
常见聚合函数与having的配合使用
SQL中常用的聚合函数包括count()、sum()、avg()、max()、min()等,这些函数和having结合可以实现多种筛选需求。
1. 使用count()结合having筛选分组数量
比如我们有一张订单表order_table,包含user_id(用户ID)、order_id(订单ID)、order_amount(订单金额)字段,现在需要筛选出下单次数大于等于3次的用户。
-- 先按用户ID分组统计每个用户的下单次数,再筛选次数>=3的分组 select user_id, count(order_id) as order_count from order_table group by user_id having count(order_id) >= 3;
2. 使用sum()结合having筛选总和条件
同样以订单表为例,需要筛选出总订单金额超过1000元的用户,就可以用sum()聚合函数计算总金额,再用having做筛选。
-- 按用户分组统计总订单金额,筛选总金额>1000的用户 select user_id, sum(order_amount) as total_amount from order_table group by user_id having sum(order_amount) > 1000;
3. 使用avg()结合having筛选平均值条件
如果要筛选出平均订单金额大于200元的用户,就可以使用avg()函数结合having实现。
-- 按用户分组计算平均订单金额,筛选平均值>200的用户 select user_id, avg(order_amount) as avg_amount from order_table group by user_id having avg(order_amount) > 200;
having和where的核心区别
很多用户容易混淆having和where的用法,两者的核心区别如下:
| 对比项 | where子句 | having子句 |
|---|---|---|
| 作用对象 | 原始数据行 | group_by分组后的结果集 |
| 执行顺序 | 在group_by之前执行 | 在group_by之后执行 |
| 是否支持聚合函数 | 不支持 | 支持 |
| 适用场景 | 筛选原始数据 | 筛选分组后的聚合结果 |
需要注意的是,如果查询中同时使用了where和having,会先执行where筛选原始数据,再对筛选后的结果做分组,最后执行having筛选分组结果。
having使用的注意事项
- having子句必须和
group_by子句配合使用,除非查询中使用了聚合函数且没有group_by,这时候整个结果集会被当作一个分组,having可以筛选这个唯一的聚合结果。 - having子句中的条件如果涉及字段,最好是
group_by中出现的分组字段,或者是聚合函数的计算结果,否则可能会出现不符合预期的结果。 - 可以在having子句中使用别名,比如前面示例中给聚合结果起的别名
order_count,在having中可以直接使用,不需要重复写聚合函数。
比如刚才统计下单次数的查询,也可以写成如下形式:
-- 使用别名简化having条件 select user_id, count(order_id) as order_count from order_table group by user_id having order_count >= 3;
复杂场景示例
如果有多个筛选条件,可以在having子句中使用逻辑运算符and、or组合条件。比如需要筛选出下单次数大于等于3次,并且总订单金额超过1000元的用户:
-- 组合多个having筛选条件
select user_id,
count(order_id) as order_count,
sum(order_amount) as total_amount
from order_table
group by user_id
having order_count >= 3 and total_amount > 1000;
掌握having结合聚合函数的用法,能帮助我们更灵活地处理SQL分组查询中的筛选需求,避免先查出所有分组结果再做二次处理的繁琐操作,提升查询效率。