MySQL的查询优化器生成执行计划时,核心依据是表相关的统计信息,这些统计信息会记录表的行数、索引的基数、数据分布特征等内容,而统计信息的采集和更新有一套固定的机制。

MySQL统计信息的核心作用
执行计划是优化器根据统计信息计算不同查询路径的成本后选择的最优方案,统计信息的准确性直接决定执行计划是否合理。如果统计信息过时,可能会出现优化器选择全表扫描而不是索引扫描、选择低效的索引连接顺序等问题,最终导致查询性能下降。
不同存储引擎的统计信息采集方式
InnoDB存储引擎
InnoDB的统计信息分为持久化统计信息和非持久化统计信息两种模式,默认开启持久化统计信息,相关配置通过innodb_stats_persistent参数控制。
持久化统计信息会存储在mysql.innodb_table_stats和mysql.innodb_index_stats系统表中,采集逻辑如下:
- 默认情况下,当表中数据变化量超过
innodb_stats_auto_recalc配置的阈值(默认10%)时,会自动触发统计信息重新采集。 - 统计信息采集时,InnoDB不会扫描全表,而是通过随机采样部分数据页来估算行数和索引基数,采样页数由
innodb_stats_persistent_sample_pages参数控制,默认是20页。 - 如果是新建表或者执行
ANALYZE TABLE命令,会强制触发全量统计信息采集吗?不会,依然采用采样的方式,只是采样过程会更完整。
MyISAM存储引擎
MyISAM的统计信息采集逻辑和InnoDB不同,它的统计信息是非持久化的,存储在内存中。当执行ANALYZE TABLE或者查询过程中需要用到统计信息时,MyISAM会直接扫描全表来统计行数和索引基数,因此对于大表执行ANALYZE TABLE的耗时会比InnoDB更长。
Analyze Table的原理与执行逻辑
ANALYZE TABLE是手动触发统计信息采集的官方命令,核心作用是更新指定表的统计信息,让优化器可以基于最新的数据分布生成合理的执行计划。
执行流程
以InnoDB引擎为例,执行ANALYZE TABLE的完整流程如下:
- 对目标表加元数据共享锁,避免表结构被修改,同时允许其他会话正常读写表数据。
- 根据配置的采样页数,随机读取表的数据页和索引页,统计每个索引的基数、表的估算行数等信息。
- 如果是持久化统计信息模式,将采集到的统计信息更新到
mysql.innodb_table_stats和mysql.innodb_index_stats系统表中,同时更新内存中的统计信息缓存。 - 释放表的元数据锁,通知所有连接的优化器缓存失效,后续生成执行计划时会使用新的统计信息。
使用示例
对单个表执行统计信息采集的命令如下:
-- 分析test库的user表,更新其统计信息 ANALYZE TABLE test.user;
执行后会返回如下结果,说明执行状态:
+-----------+---------+----------+----------+ | Table | Op | Msg_type | Msg_text | +-----------+---------+----------+----------+ | test.user | analyze | status | OK | +-----------+---------+----------+----------+
统计信息采集的注意事项
- 采样页数的配置需要平衡准确性和性能,采样页数越多统计信息越准确,但是采集过程的IO消耗也越高,对于大表可以适当调大
innodb_stats_persistent_sample_pages的值,但是不建议超过100。 - 不要在业务高峰期对大表执行
ANALYZE TABLE,虽然加的是元数据共享锁,但是采样过程会产生IO消耗,可能影响正常业务的查询性能。 - 如果发现执行计划异常,可以先检查统计信息是否过时,执行
ANALYZE TABLE后再次查看执行计划是否恢复正常。 - 可以通过查询系统表查看当前的统计信息内容,示例如下:
-- 查看test库user表的统计信息 SELECT * FROM mysql.innodb_table_stats WHERE database_name = 'test' AND table_name = 'user'; -- 查看user表各索引的统计信息 SELECT * FROM mysql.innodb_index_stats WHERE database_name = 'test' AND table_name = 'user';
统计信息与执行计划的关联验证
可以通过对比统计信息采集前后的执行计划,验证统计信息对执行计划的影响。首先查看当前表的统计信息:
-- 查看user表id索引的基数 SELECT index_name, stat_value FROM mysql.innodb_index_stats WHERE database_name = 'test' AND table_name = 'user' AND stat_name = 'n_diff_key_vals';
然后执行查询语句查看执行计划:
-- 查看查询的执行计划 EXPLAIN SELECT * FROM test.user WHERE id = 100;
如果后续表数据发生了大量变更,统计信息没有及时更新,再次执行相同的EXPLAIN语句可能会看到执行计划的变化,此时执行ANALYZE TABLE更新统计信息后,执行计划通常会恢复到合理的状态。
MySQLAnalyze_Table执行计划统计信息修改时间:2026-07-02 16:15:32