SQL是操作关系型数据库的核心语言,数据统计是日常开发和分析工作中最常见的需求之一,而GROUP BY子句就是实现分组统计功能的关键工具,它可以按照一个或多个字段对查询结果进行分组,再结合聚合函数完成每组数据的统计计算。

GROUP BY基础语法
GROUP BY的基本语法结构如下,通常和SELECT语句配合使用:
-- 基础语法 SELECT 分组字段, 聚合函数(统计字段) FROM 表名 WHERE 筛选条件 GROUP BY 分组字段 ORDER BY 排序字段;
需要注意,SELECT后面出现的非聚合函数的字段,必须出现在GROUP BY的分组字段列表中,否则查询会报错。
常见聚合函数搭配
GROUP BY通常需要和聚合函数配合使用,才能实现具体的统计需求,常用的聚合函数有以下几种:
- COUNT():统计每组的数据行数
- SUM():统计每组中数值字段的总和
- AVG():统计每组中数值字段的平均值
- MAX():统计每组中字段的最大值
- MIN():统计每组中字段的最小值
示例:单字段分组统计
假设我们有一张order_info订单表,表结构如下:
| 字段名 | 类型 | 说明 |
|---|---|---|
| order_id | int | 订单ID |
| user_id | int | 用户ID |
| goods_name | varchar | 商品名称 |
| order_amount | decimal | 订单金额 |
| order_date | date | 订单日期 |
现在需要统计每个用户的订单总数和总消费金额,SQL语句可以这样写:
SELECT
user_id,
COUNT(order_id) AS order_count,
SUM(order_amount) AS total_amount
FROM order_info
GROUP BY user_id;
示例:多字段分组统计
如果需要统计每个用户每天的下单数量,就需要按照用户ID和订单日期两个字段进行分组:
SELECT
user_id,
order_date,
COUNT(order_id) AS daily_order_count
FROM order_info
GROUP BY user_id, order_date
ORDER BY user_id, order_date;
GROUP BY使用注意事项
WHERE和HAVING的区别
WHERE子句是在分组之前对数据进行筛选,不能包含聚合函数;HAVING子句是在分组之后对分组结果进行筛选,可以包含聚合函数。比如要统计订单总数大于3的用户的总消费:
SELECT
user_id,
COUNT(order_id) AS order_count,
SUM(order_amount) AS total_amount
FROM order_info
GROUP BY user_id
HAVING order_count > 3;
分组字段的空值处理
如果分组字段存在NULL值,所有NULL值会被归为同一组进行统计,这一点在数据统计时需要注意,避免空值影响统计结果的准确性。
排序规则
GROUP BY默认不会对分组结果进行排序,如果需要按照统计结果排序,需要显式添加ORDER BY子句,比如按照总消费金额降序排列:
SELECT
user_id,
SUM(order_amount) AS total_amount
FROM order_info
GROUP BY user_id
ORDER BY total_amount DESC;
常见使用场景
GROUP BY的使用场景非常广泛,除了基础的订单统计,还可以用于用户活跃度统计、商品销量统计、地区数据汇总等各类需要分组计算的场景,只要掌握基础语法和搭配规则,就能灵活应对大部分数据统计需求。