在数据库查询开发中,嵌套子查询是常用的语法结构,但当子查询逻辑复杂且被多次引用时,会导致查询执行效率大幅降低。将嵌套子查询转化为临时表存储,是优化这类查询的有效方案。

嵌套子查询的性能问题
嵌套子查询在被执行时,数据库可能会为每一行外层查询的结果都执行一次子查询,也就是常说的相关子查询场景。如果子查询本身涉及多表关联、聚合计算等复杂操作,重复执行的开销会非常可观。比如下面这个查询,需要统计每个部门中工资高于部门平均工资的员工信息:
-- 嵌套子查询版本
SELECT
e.department_id,
e.employee_id,
e.employee_name,
e.salary
FROM
employee e
WHERE
e.salary > (
SELECT AVG(salary)
FROM employee
WHERE department_id = e.department_id
);
这个查询中,子查询SELECT AVG(salary) FROM employee WHERE department_id = e.department_id会针对employee表的每一行数据执行一次,假设员工表有10万条数据,子查询就会被执行10万次,性能会非常差。
临时表优化方案
临时表是数据库会话级别的临时存储结构,数据仅在当前会话有效,会话结束后会自动清理。我们可以先将子查询的计算结果存入临时表,再让外层查询直接引用临时表的数据,避免重复计算。
第一步:创建临时表存储子查询结果
首先把部门平均工资的计算结果存入临时表,只需要执行一次聚合计算:
-- 创建临时表存储部门平均工资
CREATE TEMPORARY TABLE tmp_department_avg_salary (
department_id INT,
avg_salary DECIMAL(10,2)
);
-- 向临时表插入部门平均工资数据
INSERT INTO tmp_department_avg_salary (department_id, avg_salary)
SELECT
department_id,
AVG(salary) AS avg_salary
FROM
employee
GROUP BY
department_id;
第二步:关联临时表完成查询
之后直接关联临时表和外层员工表,完成最终的查询逻辑:
-- 关联临时表查询目标数据
SELECT
e.department_id,
e.employee_id,
e.employee_name,
e.salary
FROM
employee e
INNER JOIN
tmp_department_avg_salary t
ON e.department_id = t.department_id
WHERE
e.salary > t.avg_salary;
优化效果对比
我们可以通过执行计划查看两种方式的性能差异,以下是两种方案的对比情况:
| 方案类型 | 子查询执行次数 | 全表扫描次数 | 预估执行时间 |
|---|---|---|---|
| 嵌套子查询方案 | 等于员工表行数 | 等于员工表行数 | 1200ms |
| 临时表方案 | 1次 | 2次(一次聚合、一次关联) | 85ms |
从对比可以看出,临时表方案大幅减少了子查询的执行次数和全表扫描次数,执行时间缩短了90%以上。
注意事项
- 临时表仅在当前会话有效,不同会话的临时表数据相互隔离,不需要担心数据冲突。
- 如果子查询结果集较小,临时表的创建和插入开销可以忽略;如果结果集很大,需要评估临时表的存储开销,必要时可以给临时表的关联字段添加索引。
- 部分数据库支持派生表(也就是FROM子句中的子查询),但派生表在某些数据库优化器中还是会被重复执行,临时表的稳定性更好。
实际优化时,建议先通过执行计划分析嵌套子查询的执行成本,再决定是否使用临时表方案,避免不必要的优化操作。