在数据库设计中,当单表数据量过大时,通常会采用分表策略,将同类型数据拆分到多个结构完全相同的分表中存储,比如按月份拆分订单表得到order_202401、order_202402等。当需要整合这些分表的数据并和其他表做关联查询时,可以使用UNION ALL配合JOIN操作实现。

UNION ALL和JOIN的基础用法
UNION ALL的作用
UNION ALL用于合并多个SELECT语句的结果集,要求每个SELECT语句的列数、列顺序和数据类型完全一致,它不会去重,执行效率比UNION更高,适合合并同结构的分表数据。
JOIN的作用
JOIN用于将两个或多个表按照关联条件组合查询,常见的有INNER JOIN、LEFT JOIN等,可根据需求获取不同维度的关联数据。
组合使用UNION ALL和JOIN的实现步骤
整体思路是先通过UNION ALL将所有同结构的分表合并成一个临时结果集,再将这个临时结果集和其他需要关联的表做JOIN操作。
步骤1:用UNION ALL合并多个分表
假设存在结构相同的订单分表order_202401、order_202402,都包含order_id、user_id、order_amount、create_time字段,合并语句如下:
-- 合并两个订单分表 SELECT order_id, user_id, order_amount, create_time FROM order_202401 UNION ALL SELECT order_id, user_id, order_amount, create_time FROM order_202402
步骤2:将合并结果作为临时表做JOIN关联
如果需要将合并后的订单数据和用户表user_info做关联,获取订单对应的用户名称,可以使用以下查询:
-- 合并分表后关联用户表
SELECT
t.order_id,
t.user_id,
u.user_name,
t.order_amount,
t.create_time
FROM (
-- 子查询合并分表
SELECT order_id, user_id, order_amount, create_time
FROM order_202401
UNION ALL
SELECT order_id, user_id, order_amount, create_time
FROM order_202402
) t
INNER JOIN user_info u ON t.user_id = u.user_id
多分表场景的扩展写法
如果存在更多同结构的分表,只需要在UNION ALL后继续拼接对应的SELECT语句即可,比如再增加order_202403分表:
SELECT
t.order_id,
t.user_id,
u.user_name,
t.order_amount,
t.create_time
FROM (
SELECT order_id, user_id, order_amount, create_time
FROM order_202401
UNION ALL
SELECT order_id, user_id, order_amount, create_time
FROM order_202402
UNION ALL
SELECT order_id, user_id, order_amount, create_time
FROM order_202403
) t
INNER JOIN user_info u ON t.user_id = u.user_id
注意事项
- 使用UNION ALL合并的分表必须保证列结构完全一致,否则会报语法错误。
- 如果分表数量非常多,建议先确认合并后的数据量,避免临时结果集过大影响查询性能。
- 如果不需要关联其他表,仅需要合并分表数据,直接使用UNION ALL即可,不需要额外做JOIN操作。
- 如果需要对合并后的结果做排序,需要在最外层查询添加ORDER BY子句,子查询中的排序通常无效。
适用场景
这种组合方式适合需要整合多个同结构分表的数据,同时还需要和其他维度表做关联分析的场景,比如统计多个月份的订单对应的用户留存情况、跨分表的订单金额汇总等。