SQL中的相关性子查询(correlated subquery)是指子查询的执行依赖于外部查询的行数据,每一行外部查询数据都会触发一次子查询执行。当子查询没有合适的索引支撑,或者逻辑设计不合理时,就可能出现全表扫描的情况,严重拖慢查询速度。

相关性子查询引发全表扫描的原因
相关性子查询的执行逻辑是外部查询每取到一行记录,就会把该行对应字段的值传入子查询执行一次,如果子查询的where条件没有命中索引,或者子查询本身需要遍历整个表来匹配条件,就会产生全表扫描。比如下面的查询场景,我们要查询订单表中订单金额高于对应客户平均订单金额的订单记录。
-- 未优化的相关性子查询示例
SELECT o.order_id, o.customer_id, o.order_amount
FROM orders o
WHERE o.order_amount > (
SELECT AVG(o2.order_amount)
FROM orders o2
WHERE o2.customer_id = o.customer_id
);
如果orders表的customer_id字段没有索引,那么子查询中每一次匹配o.customer_id的操作都需要全表扫描o2表,外部查询有多少行记录,就会执行多少次全表扫描,性能会非常差。
优化方案一:改写为连接查询
大多数相关性子查询都可以改写为连接查询,连接查询的执行计划更容易被优化器优化,也更容易利用索引。上面的示例可以改写为先计算出每个客户的平均订单金额,再和原订单表做连接筛选。
-- 改写为连接查询的优化版本
SELECT o.order_id, o.customer_id, o.order_amount
FROM orders o
INNER JOIN (
SELECT customer_id, AVG(order_amount) AS avg_amount
FROM orders
GROUP BY customer_id
) t ON o.customer_id = t.customer_id
WHERE o.order_amount > t.avg_amount;
改写后的查询先计算一次每个客户的平均订单金额,再和主表做一次连接操作,避免了子查询重复执行的问题,只要给customer_id字段添加索引,就可以快速完成分组和连接操作。
优化方案二:添加合适的索引
如果必须保留相关性子查询的写法,可以通过添加合适的索引来避免全表扫描。针对上面的示例,我们可以给orders表的customer_id和order_amount字段添加联合索引,这样子查询在匹配customer_id的时候可以快速定位数据,同时计算平均值的时候也可以直接利用索引中的数据,不需要回表查询。
-- 添加联合索引的语句 CREATE INDEX idx_customer_amount ON orders(customer_id, order_amount);
添加索引之后,子查询执行的时候会走idx_customer_amount索引,不需要全表扫描,查询性能会有明显提升。
优化方案三:调整查询逻辑减少子查询执行次数
如果相关性子查询的查询条件和外部查询的关联逻辑比较简单,也可以通过调整查询逻辑,把子查询的结果提前计算出来,避免重复执行。比如上面的场景,也可以先通过临时表存储每个客户的平均订单金额,再和主表关联查询。
-- 使用临时表优化的示例 -- 创建临时表存储客户平均订单金额 CREATE TEMPORARY TABLE tmp_customer_avg AS SELECT customer_id, AVG(order_amount) AS avg_amount FROM orders GROUP BY customer_id; -- 添加临时表索引 CREATE INDEX idx_tmp_customer ON tmp_customer_avg(customer_id); -- 查询最终结果 SELECT o.order_id, o.customer_id, o.order_amount FROM orders o INNER JOIN tmp_customer_avg t ON o.customer_id = t.customer_id WHERE o.order_amount > t.avg_amount; -- 删除临时表 DROP TEMPORARY TABLE tmp_customer_avg;
这种方式适合子查询结果复用性高的场景,临时表只需要计算一次,后续查询直接复用结果,减少了重复计算的开销。
优化效果验证
我们可以通过SQL的EXPLAIN命令来查看优化前后的执行计划,判断是否存在全表扫描。优化前执行EXPLAIN会看到子查询部分出现ALL类型,也就是全表扫描;优化后无论是改写连接还是添加索引,子查询或者连接部分的扫描类型都会变成ref或者range,说明已经避免了全表扫描。
-- 查看优化前的执行计划
EXPLAIN
SELECT o.order_id, o.customer_id, o.order_amount
FROM orders o
WHERE o.order_amount > (
SELECT AVG(o2.order_amount)
FROM orders o2
WHERE o2.customer_id = o.customer_id
);
-- 查看优化后的执行计划
EXPLAIN
SELECT o.order_id, o.customer_id, o.order_amount
FROM orders o
INNER JOIN (
SELECT customer_id, AVG(order_amount) AS avg_amount
FROM orders
GROUP BY customer_id
) t ON o.customer_id = t.customer_id
WHERE o.order_amount > t.avg_amount;
通过执行计划的对比,可以直观地看到优化效果,确认全表扫描的问题已经解决。
SQLcorrelated_subquery全表扫描查询优化修改时间:2026-06-17 15:12:34