SQL嵌套查询中实现多表合并统计是数据库开发中的常见需求,当需要从多个结构相同但存储不同业务数据的表中提取信息并统一汇总时,结合UNION ALL与子查询可以快速完成目标,不需要多次单独查询后再手动整合数据。

核心概念说明
UNION ALL用于合并多个SELECT语句的结果集,不会去除重复行,执行效率比UNION更高,适合确认无重复数据或允许重复的场景。子查询是嵌套在主查询内部的查询语句,可以作为临时结果集参与后续统计。
使用这种组合的前提是参与合并的多个子查询返回的列数、列顺序、数据类型必须完全一致,否则会直接报错。
基础实现步骤
实现多表合并统计的核心步骤如下:
- 编写每个单表的子查询,提取需要的字段并做初步统计
- 用UNION ALL将多个子查询的结果集合并
- 在外层嵌套主查询,对合并后的结果集做最终的汇总统计
实际案例演示
假设有三个订单表,分别存储2023年之前、2023年、2024年的订单数据,表结构完全相同,包含order_id、user_id、order_amount、order_date四个字段,现在需要统计所有年份的订单总金额、总订单数,以及每个用户的订单总金额。
单表子查询编写
先分别编写三个表的子查询,提取年份标识和需要的统计字段:
-- 2023年之前的订单子查询
SELECT
'before_2023' AS data_source,
user_id,
SUM(order_amount) AS user_total_amount,
COUNT(order_id) AS user_order_count
FROM orders_before_2023
GROUP BY user_id
UNION ALL
-- 2023年订单子查询
SELECT
'year_2023' AS data_source,
user_id,
SUM(order_amount) AS user_total_amount,
COUNT(order_id) AS user_order_count
FROM orders_2023
GROUP BY user_id
UNION ALL
-- 2024年订单子查询
SELECT
'year_2024' AS data_source,
user_id,
SUM(order_amount) AS user_total_amount,
COUNT(order_id) AS user_order_count
FROM orders_2024
GROUP BY user_id
外层嵌套主查询统计
将上面的UNION ALL结果作为子查询,在外层做最终汇总:
SELECT
user_id,
SUM(user_total_amount) AS total_order_amount,
SUM(user_order_count) AS total_order_count,
COUNT(DISTINCT data_source) AS involve_year_count
FROM (
-- 2023年之前的订单子查询
SELECT
'before_2023' AS data_source,
user_id,
SUM(order_amount) AS user_total_amount,
COUNT(order_id) AS user_order_count
FROM orders_before_2023
GROUP BY user_id
UNION ALL
-- 2023年订单子查询
SELECT
'year_2023' AS data_source,
user_id,
SUM(order_amount) AS user_total_amount,
COUNT(order_id) AS user_order_count
FROM orders_2023
GROUP BY user_id
UNION ALL
-- 2024年订单子查询
SELECT
'year_2024' AS data_source,
user_id,
SUM(order_amount) AS user_total_amount,
COUNT(order_id) AS user_order_count
FROM orders_2024
GROUP BY user_id
) AS merged_orders
GROUP BY user_id
ORDER BY total_order_amount DESC;
注意事项
- 如果确认多个表之间存在重复数据,需要去重后再统计,可以把UNION ALL替换为UNION,但要注意UNION会触发排序去重,性能会有所下降
- 子查询中的列别名需要和主查询的引用对应,避免字段名不匹配导致报错
- 如果单表数据量较大,建议先给子查询中的分组字段添加索引,提升子查询的执行效率,进而提升整个嵌套查询的速度
- 可以在子查询中增加WHERE条件过滤无效数据,减少合并后的数据量,降低外层统计的压力
适用场景总结
这种方案适合以下场景:
- 业务数据按时间、地区等维度拆分到多个结构相同的表中
- 需要跨多个同构表做统一的汇总统计
- 不需要频繁关联多个表的复杂字段,仅需要统计已有字段的聚合值
通过合理拆分子查询逻辑,再结合UNION ALL合并结果,最后在外层做统一统计,可以让多表合并统计的SQL逻辑更清晰,也更容易维护和排查问题。