MySQL联合索引指的是由多个列共同组成的索引,和单列索引相比,它能在覆盖更多查询场景的同时减少索引数量,降低存储开销。合理的联合索引设计可以大幅提升查询效率,而不合理的设计则可能导致索引失效,无法发挥预期作用。

联合索引的基础概念
联合索引也叫多列索引,是在表的多个字段上创建的索引,其本质是将多个列的值按顺序拼接后构建B+树结构。索引的排序规则是先按照第一个列排序,第一个列值相同的情况下再按照第二个列排序,以此类推。我们可以通过以下语句创建联合索引:
-- 在user表的age、name、create_time三个字段上创建联合索引 CREATE INDEX idx_age_name_ct ON user(age, name, create_time);
联合索引设计的核心原则
1. 最左前缀匹配原则
这是联合索引生效的核心前提,查询条件必须从索引的最左列开始匹配,不能跳过左侧的列直接使用后面的列作为查询条件。比如上面的idx_age_name_ct索引,以下查询可以命中索引:
-- 命中索引:使用最左列age SELECT * FROM user WHERE age = 20; -- 命中索引:使用age和name,连续匹配前两个列 SELECT * FROM user WHERE age = 20 AND name = '张三'; -- 命中索引:使用三个列,连续匹配所有列 SELECT * FROM user WHERE age = 20 AND name = '张三' AND create_time > '2024-01-01';
而以下查询无法命中该联合索引:
-- 跳过age列,直接使用name查询,无法命中联合索引 SELECT * FROM user WHERE name = '张三'; -- 跳过中间的name列,使用age和create_time查询,只能用到age部分的索引 SELECT * FROM user WHERE age = 20 AND create_time > '2024-01-01';
2. 列顺序选择原则
联合索引中列的顺序直接影响索引的适用范围,通常遵循两个优先级:
- 区分度高的列放在前面:区分度指的是列中不同值的数量占总行数的比例,比例越高区分度越高。把区分度高的列放在前面,能更快过滤掉不符合条件的数据,减少后续扫描范围。
- 频繁作为查询条件的列放在前面:如果某个列经常出现在查询的WHERE条件中,优先将其放在联合索引的左侧,提高索引的命中概率。
比如用户表中,user_id的区分度远高于status,如果查询经常同时用到这两个字段,应该把user_id放在联合索引的前面:
-- 合理顺序:高区分度的user_id在前 CREATE INDEX idx_userid_status ON user(user_id, status);
3. 避免冗余索引原则
如果已经存在联合索引(a, b, c),那么就不需要再单独创建(a)、(a, b)这两个索引,因为联合索引的前缀部分已经可以满足这两个索引的查询场景,冗余索引只会增加写入时的维护成本和存储空间。可以通过查询information_schema.statistics表来排查冗余索引:
SELECT
TABLE_NAME,
INDEX_NAME,
GROUP_CONCAT(COLUMN_NAME ORDER BY SEQ_IN_INDEX) AS index_columns
FROM information_schema.statistics
WHERE TABLE_SCHEMA = '你的数据库名'
GROUP BY TABLE_NAME, INDEX_NAME
HAVING index_columns LIKE 'a%';
4. 范围查询列放最后原则
如果联合索引中包含范围查询的列(比如>、<、BETWEEN等条件),需要把这类列放在索引的最后面。因为范围查询之后的列无法再使用索引的有序性进行匹配,放在后面能最大程度利用索引的前缀有序特性。
比如查询经常需要根据age等值查询,根据create_time范围查询,那么索引应该设计为(age, create_time),而不是(create_time, age):
-- 合理设计:范围列create_time放最后 CREATE INDEX idx_age_ct ON user(age, create_time); -- 该查询可以充分利用整个联合索引 SELECT * FROM user WHERE age = 20 AND create_time > '2024-01-01';
联合索引的覆盖索引特性
如果查询的所有字段都包含在联合索引中,那么查询不需要回表查询聚簇索引,直接通过联合索引就能返回结果,这就是覆盖索引,能大幅提升查询性能。比如联合索引是(age, name),以下查询可以直接命中覆盖索引:
-- 查询字段都在联合索引中,触发覆盖索引 SELECT age, name FROM user WHERE age = 20 AND name = '张三';
因此设计联合索引时,可以适当考虑把查询中经常返回的字段加入联合索引,减少回表次数,但要注意控制索引长度,避免索引过大。
常见设计误区
- 误区1:联合索引列顺序随意排列,不考虑查询场景和区分度,导致索引命中率低。
- 误区2:过度创建联合索引,每个查询场景都单独创建索引,导致写入性能下降。
- 误区3:在联合索引中把范围查询列放在前面,导致后面的列无法使用索引。
- 误区4:忽略最左前缀原则,认为只要查询条件包含联合索引的所有列就能命中索引,实际上顺序不匹配也无法生效。
总结
MySQL联合索引的设计需要结合业务查询场景,遵循最左前缀匹配、高区分度列优先、范围列放最后、避免冗余等原则,同时合理利用覆盖索引特性提升查询效率。设计完成后可以通过EXPLAIN命令分析查询的执行计划,验证索引是否生效,再根据实际效果调整索引结构,最终达到性能和存储成本的平衡。
-- 使用EXPLAIN分析查询是否命中联合索引 EXPLAIN SELECT * FROM user WHERE age = 20 AND name = '张三';