覆盖索引是MySQL索引优化中非常实用的技巧,它的核心逻辑是查询需要的所有列都包含在某个索引中,数据库引擎可以直接从索引中获取全部所需数据,不需要再回到主键索引或者数据行中查找,从而减少磁盘IO次数,提升查询效率。
覆盖索引的工作原理
MySQL的索引分为聚簇索引和非聚簇索引,聚簇索引的叶子节点存储的是完整的数据行,非聚簇索引的叶子节点存储的是索引列的值和对应的主键值。当使用非聚簇索引查询时,如果查询的列不在索引中,就需要拿着主键值回到聚簇索引中查找完整数据行,这个过程就是回表。
如果查询的所有列都包含在非聚簇索引中,那么引擎直接从非聚簇索引的叶子节点就能拿到全部需要的数据,不需要回表,这种情况就是使用了覆盖索引。比如有一张用户表,索引是idx_name_age(name, age),执行查询SELECT name, age FROM user WHERE name = '张三',就不需要回表,直接走覆盖索引即可。
创建覆盖索引的方法
1. 合理设计联合索引
覆盖索引通常是联合索引,需要根据查询的字段来设计索引的列顺序。联合索引遵循最左前缀原则,所以需要把查询中过滤条件的列放在前面,查询返回的列放在后面。
比如业务中有这样的查询需求:经常需要根据用户的状态查询用户的ID和昵称,用户表的结构如下:
CREATE TABLE user (
id INT PRIMARY KEY AUTO_INCREMENT,
nickname VARCHAR(50) NOT NULL,
status TINYINT NOT NULL DEFAULT 1,
create_time DATETIME NOT NULL,
INDEX idx_status_create_time (status, create_time)
);
如果查询语句是SELECT id, nickname FROM user WHERE status = 1,现有的idx_status_create_time索引不包含id和nickname列,无法使用覆盖索引。我们可以调整联合索引的列,把id和nickname加入索引:
-- 删除旧索引,创建新的联合索引 DROP INDEX idx_status_create_time ON user; CREATE INDEX idx_status_id_nickname ON user (status, id, nickname);
这样查询SELECT id, nickname FROM user WHERE status = 1时,所有需要的列都在idx_status_id_nickname索引中,就可以使用覆盖索引。
2. 避免SELECT * 查询
使用SELECT *会查询表的所有列,很难让所有列都包含在同一个索引中,所以几乎不可能使用覆盖索引。优化时应该只查询需要的列,这样更容易命中覆盖索引。
3. 利用主键索引的特性
因为聚簇索引的叶子节点存储完整数据行,所以如果查询的列包含主键,非聚簇索引的叶子节点本身就会存储主键值,所以不需要额外把主键加入索引也能命中覆盖索引。比如上面的用户表,id是主键,查询SELECT id, status FROM user WHERE status = 1,使用idx_status_create_time索引时,status在索引中,id是主键默认在索引叶子节点中,所以也能使用覆盖索引。
验证是否使用了覆盖索引
可以通过EXPLAIN命令查看查询的执行计划,判断有没有使用覆盖索引。如果执行计划的Extra列出现Using index,就说明使用了覆盖索引。
还是以上面的用户表为例,执行以下命令:
EXPLAIN SELECT id, nickname FROM user WHERE status = 1;
如果创建的是idx_status_id_nickname索引,执行计划的Extra列会显示Using index,说明命中了覆盖索引。如果没有命中,Extra列可能是NULL或者显示Using where,就需要调整索引设计。
覆盖索引的注意事项
- 覆盖索引会占用更多的磁盘空间,因为索引中存储了更多的列,所以需要根据实际查询频率来设计,不要盲目给所有查询都加覆盖索引。
- 如果查询中使用了函数或者表达式操作索引列,可能会导致覆盖索引失效。比如
SELECT name, age FROM user WHERE LEFT(name, 2) = '张',即使有idx_name_age索引,也无法使用覆盖索引。 - 当表的数据量很小时,覆盖索引的优化效果不明显,因为全表扫描的代价本身很低,不需要额外维护覆盖索引增加开销。
- 如果查询需要排序,并且排序的字段也在覆盖索引中,还可以避免额外的排序操作,进一步提升性能,执行计划的
Extra列会同时出现Using index和Using index condition。
实际优化案例
某电商系统的订单表有千万级数据,有一个高频查询是SELECT order_id, user_id, order_status FROM order WHERE user_id = 123 AND order_status = 2,原来的索引是idx_user_id(user_id),查询耗时在200ms左右。
分析查询需要的列是order_id、user_id、order_status,其中order_id是主键,user_id和order_status是过滤条件,所以创建联合索引idx_user_id_status(user_id, order_status),这样三个列都在索引中,查询可以直接走覆盖索引,不需要回表。优化后查询耗时降低到10ms以内,性能提升非常明显。
覆盖索引是MySQL查询优化中性价比很高的手段,不需要修改业务逻辑,只需要合理调整索引设计就能获得明显的性能提升。开发者在日常开发中,遇到查询性能问题时,可以优先检查是否可以通过覆盖索引来优化,减少不必要的回表操作。