在SQL数据库查询中,union和union all是专门用于合并两个或多个SELECT语句结果集的操作符,两者都能实现多查询结果拼接的功能,但在实际特性和适用场景上有明显不同。

union和union all的基本定义
union操作符用于将多个SELECT语句的结果集合并成一个结果集,合并过程中会自动对最终结果进行去重处理,重复的记录只保留一条。而union all操作符同样用于合并多个SELECT语句的结果集,但不会进行去重操作,所有查询返回的记录都会原样保留到最终结果中。
需要注意的是,使用这两个操作符时,所有参与合并的SELECT语句必须满足以下条件:
- 每个SELECT语句返回的列数必须相同
- 对应列的数据类型必须兼容
- 列的顺序必须一致
核心差异对比
两者的核心区别主要体现在去重机制、执行效率、排序行为三个方面,具体对比如下:
| 对比维度 | union | union all |
|---|---|---|
| 结果去重 | 自动去除重复记录 | 保留所有记录,不去重 |
| 执行效率 | 较低,需要额外的去重排序操作 | 较高,直接拼接结果集无额外操作 |
| 默认排序 | 可能会对结果集进行排序 | 不会对结果集排序,按查询顺序拼接 |
代码示例演示
假设我们有一个用户表user_info,表结构和测试数据如下:
-- 创建用户表
CREATE TABLE user_info (
id INT PRIMARY KEY,
user_name VARCHAR(50),
age INT
);
-- 插入测试数据
INSERT INTO user_info VALUES (1, '张三', 20);
INSERT INTO user_info VALUES (2, '李四', 22);
INSERT INTO user_info VALUES (3, '张三', 20);
INSERT INTO user_info VALUES (4, '王五', 25);
使用union查询
查询所有用户姓名,使用union去重:
SELECT user_name FROM user_info UNION SELECT user_name FROM user_info WHERE age > 20;
上述查询的结果会返回张三、李四、王五三条记录,其中重复的张三只保留一条。
使用union all查询
同样的查询条件,换成union all:
SELECT user_name FROM user_info UNION ALL SELECT user_name FROM user_info WHERE age > 20;
此时结果会返回四条记录,分别是张三、李四、张三、王五,所有记录都原样保留,没有去重。
使用场景选择
在实际开发中,可以按照以下原则选择使用哪个操作符:
- 如果明确知道多个查询结果不会有重复记录,或者不需要去重,优先使用union all,能够提升查询效率,减少数据库的资源消耗
- 如果需要确保最终结果没有重复记录,再使用union,避免重复数据影响业务逻辑
- 如果参与合并的查询结果量非常大,除非必须去重,否则不要使用union,避免去重操作带来的性能损耗
常见使用误区
很多用户在使用这两个操作符时会遇到一些问题,常见的误区包括:
- 认为union和union all只是去重差异,忽略效率问题,在大结果集场景下盲目使用union导致查询变慢
- 参与合并的SELECT语句列数不一致,或者对应列数据类型不兼容,导致执行报错
- 误以为union all的结果顺序和union一致,实际上union all的结果顺序只和各个SELECT语句的执行顺序有关,不会额外排序
注意:如果需要对合并后的结果集进行排序,建议在最后一个SELECT语句之后添加ORDER BY子句,而不是在每个SELECT语句中单独排序,这样能保证最终结果的顺序符合预期。