MySQL执行SQL语句的过程包含多个环节,从客户端发送请求到最终返回结果,每个环节的性能损耗都会影响整体查询效率。理解这个执行流程,才能从根源上找到SQL优化的方向,而不是盲目调整语句。

MySQL的SQL执行流程拆解
一条SQL语句在MySQL中的执行大致分为以下几个步骤:
- 客户端发送SQL语句到MySQL服务器
- 服务器先检查查询缓存,如果命中缓存直接返回结果
- 进行语法解析和语义分析,生成解析树
- 优化器对解析树进行优化,选择最优执行计划
- 执行器根据执行计划调用存储引擎接口获取数据
- 返回结果给客户端
基于执行流程的SQL优化方法
1. 针对查询缓存环节的优化
查询缓存的命中率通常较低,尤其是频繁更新的表,缓存很容易失效。如果业务场景中没有大量重复查询,建议关闭查询缓存,避免缓存维护带来的额外开销。可以在MySQL配置文件中设置query_cache_type=0关闭该功能。
2. 针对语法解析和优化器环节的优化
优化器会选择它认为最优的执行计划,但有时候我们的业务需求更清楚数据分布,可以通过合理的索引设计引导优化器做出正确选择。
索引设计优化
索引是优化器选择高效执行计划的核心依据,设计索引时需要注意以下几点:
- 优先为查询条件的字段建立索引,尤其是
where、join on、order by、group by涉及的字段 - 避免建立过多冗余索引,冗余索引会增加写入时的维护成本
- 联合索引要遵循最左前缀原则,把区分度高的字段放在前面
- 不要在索引字段上做函数运算或者类型转换,否则索引会失效
比如我们有一个用户表,经常需要根据手机号和注册时间查询用户,那么可以建立联合索引(phone, register_time),而不是单独为两个字段建索引。
避免优化器误判的写法
有些写法会让优化器无法正确使用索引,需要尽量避免:
- 不要使用
select *,只查询需要的字段,减少回表次数 - 查询条件中不要使用
or,如果or两边的字段有一个没有索引,整个查询就不会走索引 - 范围查询之后的索引字段会失效,联合索引中范围查询字段尽量放在最后
3. 针对执行器环节的优化
执行器会根据优化器选择的执行计划调用存储引擎接口,这个环节可以通过调整查询逻辑减少存储引擎的访问次数。
减少全表扫描
全表扫描会遍历整张表的数据,当表数据量较大时性能会非常差。除了建立合适的索引,还可以通过限制查询范围来减少扫描数据量,比如分页查询时避免大偏移量的limit。
错误的分页写法示例:
-- 偏移量10000,会扫描前10000条数据再返回后面的10条,性能差 select id, name, phone from user limit 10000, 10;
优化后的分页写法:
-- 先通过索引定位到偏移位置的id,再查询数据,减少扫描量 select id, name, phone from user where id > (select id from user limit 10000, 1) limit 10;
优化join查询
join查询时要让小表驱动大表,也就是把数据量小的表放在join的左边,这样外层循环的次数更少。同时要为join的关联字段建立索引,避免嵌套循环时的全表扫描。
示例:假设user表有1000条数据,order表有100000条数据,查询用户对应的订单:
-- 小表user驱动大表order,关联字段user_id建立索引 select u.name, o.order_no from user u join order o on u.id = o.user_id where u.status = 1;
4. 执行计划分析
写完SQL后可以通过explain命令查看执行计划,判断优化是否生效。explain结果中需要重点关注的字段有:
| 字段名 | 含义 | 优化参考 |
|---|---|---|
| type | 访问类型 | 尽量达到ref、eq_ref级别,避免all全表扫描 |
| key | 实际使用的索引 | 如果是null说明没有使用索引,需要调整索引或查询条件 |
| rows | 预估扫描的行数 | 行数越少说明查询效率越高 |
| Extra | 额外信息 | 出现Using filesort、Using temporary说明需要优化排序或分组逻辑 |
示例:分析一条查询语句的执行计划
explain select id, name from user where phone = '13800138000';
总结
用执行流程思维写SQL,就是从SQL进入MySQL后的每个处理环节出发,针对性减少每个环节的性能损耗。核心思路是减少不必要的数据扫描、引导优化器选择最优执行计划、降低存储引擎的访问压力。平时写SQL时多结合explain分析执行计划,慢慢就能形成高效的SQL编写习惯,从根源上避免慢查询问题。