在mysql的索引查询场景中,回表是一个经常被提到的概念,它和索引的结构、查询的执行流程直接相关。理解回表需要先搞清楚mysql的两类核心索引结构,再结合查询过程分析它的产生原因和影响。

mysql的两类核心索引结构
mysql的索引按照存储结构可以分为聚簇索引和非聚簇索引,两者的存储方式和查询逻辑有本质区别。
聚簇索引
聚簇索引也叫主键索引,它的叶子节点存储的是整行数据。也就是说,只要通过聚簇索引查询,拿到叶子节点就可以直接获取到该行所有的字段值,不需要额外查询其他数据页。InnoDB引擎默认会为表创建聚簇索引,如果表没有显式定义主键,会选择一个唯一非空索引作为聚簇索引,如果没有符合条件的索引,会隐式创建一个隐藏的row_id作为聚簇索引。
非聚簇索引
非聚簇索引也叫二级索引,它的叶子节点存储的不是整行数据,而是该索引对应的字段值加上对应的主键值。常见的普通索引、唯一索引、联合索引都属于非聚簇索引。通过非聚簇索引查询时,只能先拿到对应的主键值,无法直接获取其他字段的数据。
什么是mysql回表
回表指的是通过非聚簇索引查询时,先根据非聚簇索引找到对应的主键值,再拿着主键值去聚簇索引中查找整行数据的过程。简单来说,就是一次查询需要访问两次索引树:先访问非聚簇索引树,再访问聚簇索引树,第二次访问聚簇索引树的过程就是回表。
举个具体的例子,假设我们有一张用户表,结构如下:
CREATE TABLE `user` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(50) DEFAULT NULL, `age` int(11) DEFAULT NULL, `email` varchar(100) DEFAULT NULL, PRIMARY KEY (`id`), -- 聚簇索引 KEY `idx_name` (`name`) -- 非聚簇索引 ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
如果我们执行如下查询语句:
SELECT * FROM user WHERE name = '张三';
查询的执行流程是:
- 先通过非聚簇索引
idx_name查找name='张三'的记录,拿到对应的id主键值 - 拿着这个
id去聚簇索引中查找整行数据,因为SELECT *需要所有字段,聚簇索引的叶子节点才存储了完整的行数据 - 第二步去聚簇索引查找的过程,就是回表
什么时候会发生回表
并不是所有使用非聚簇索引的查询都会发生回表,只有当查询需要的字段无法从非聚簇索引的叶子节点中全部获取时,才会触发回表。
还是以上面的用户表为例,如果我们执行如下查询:
SELECT id, name FROM user WHERE name = '张三';
这个查询需要的字段是id和name,而非聚簇索引idx_name的叶子节点刚好存储了name字段值和对应的id值,所以不需要回表,直接通过非聚簇索引就可以拿到所有需要的字段,这种情况叫做索引覆盖。
如果查询中包含了非聚簇索引没有的字段,比如age、email,就必须要回表去聚簇索引中获取这些字段的值。
回表对查询性能的影响
回表本身是需要额外消耗性能的,因为一次回表意味着要多一次索引树的查询,如果查询返回的数据量很大,回表的次数也会很多,会明显提升查询的耗时。
我们可以通过EXPLAIN命令查看查询的执行计划,判断是否存在回表。如果执行计划的Extra列显示Using index,说明使用了索引覆盖,没有回表;如果没有这个提示,且查询用到了非聚簇索引,大概率存在回表。
比如上面的两个查询,第一个SELECT *的查询执行计划不会有Using index,第二个SELECT id, name的查询执行计划会显示Using index。
减少回表的优化方法
实际开发中,我们可以通过一些方法减少回表次数,提升查询性能:
- 尽量使用索引覆盖:查询时只选择索引中包含的字段,或者建立联合索引覆盖常用的查询字段,避免查询多余的字段。比如如果经常需要查询
name和age,可以建立联合索引idx_name_age (name, age),这样查询这两个字段时就不需要回表。 - 避免使用
SELECT *:SELECT *会查询所有字段,很容易导致需要回表,只查询需要的字段可以减少回表的概率。 - 合理设计索引:根据业务查询场景设计合适的索引,尽量让常用的查询可以通过索引覆盖完成,减少回表次数。
总结
回表是mysql中通过非聚簇索引查询时的一个常见过程,本质是二次访问聚簇索引获取完整行数据。理解回表的产生条件和影响,有助于我们更好地设计索引和编写查询语句,通过索引覆盖等方式减少回表,提升查询效率。掌握索引的结构和查询原理,是优化mysql查询性能的基础。