MySQL执行计划中的统计信息是如何采集的

来源:站长素材作者:小菜鸟头衔:草根站长
导读:本期聚焦于小伙伴创作的《MySQL执行计划中的统计信息是如何采集的》,敬请观看详情,探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《MySQL执行计划中的统计信息是如何采集的》有用,将其分享出去将是对创作者最好的鼓励。

MySQL的查询优化器生成执行计划时,核心依据是表相关的统计信息,这些统计信息会记录表的行数、索引的基数、数据分布特征等内容,而统计信息的采集和更新有一套固定的机制。

MySQL执行计划中的统计信息是如何采集的

MySQL统计信息的核心作用

执行计划是优化器根据统计信息计算不同查询路径的成本后选择的最优方案,统计信息的准确性直接决定执行计划是否合理。如果统计信息过时,可能会出现优化器选择全表扫描而不是索引扫描、选择低效的索引连接顺序等问题,最终导致查询性能下降。

不同存储引擎的统计信息采集方式

InnoDB存储引擎

InnoDB的统计信息分为持久化统计信息和非持久化统计信息两种模式,默认开启持久化统计信息,相关配置通过innodb_stats_persistent参数控制。

持久化统计信息会存储在mysql.innodb_table_statsmysql.innodb_index_stats系统表中,采集逻辑如下:

  • 默认情况下,当表中数据变化量超过innodb_stats_auto_recalc配置的阈值(默认10%)时,会自动触发统计信息重新采集。
  • 统计信息采集时,InnoDB不会扫描全表,而是通过随机采样部分数据页来估算行数和索引基数,采样页数由innodb_stats_persistent_sample_pages参数控制,默认是20页。
  • 如果是新建表或者执行ANALYZE TABLE命令,会强制触发全量统计信息采集吗?不会,依然采用采样的方式,只是采样过程会更完整。

MyISAM存储引擎

MyISAM的统计信息采集逻辑和InnoDB不同,它的统计信息是非持久化的,存储在内存中。当执行ANALYZE TABLE或者查询过程中需要用到统计信息时,MyISAM会直接扫描全表来统计行数和索引基数,因此对于大表执行ANALYZE TABLE的耗时会比InnoDB更长。

Analyze Table的原理与执行逻辑

ANALYZE TABLE是手动触发统计信息采集的官方命令,核心作用是更新指定表的统计信息,让优化器可以基于最新的数据分布生成合理的执行计划。

执行流程

以InnoDB引擎为例,执行ANALYZE TABLE的完整流程如下:

  1. 对目标表加元数据共享锁,避免表结构被修改,同时允许其他会话正常读写表数据。
  2. 根据配置的采样页数,随机读取表的数据页和索引页,统计每个索引的基数、表的估算行数等信息。
  3. 如果是持久化统计信息模式,将采集到的统计信息更新到mysql.innodb_table_statsmysql.innodb_index_stats系统表中,同时更新内存中的统计信息缓存。
  4. 释放表的元数据锁,通知所有连接的优化器缓存失效,后续生成执行计划时会使用新的统计信息。

使用示例

对单个表执行统计信息采集的命令如下:

-- 分析test库的user表,更新其统计信息
ANALYZE TABLE test.user;

执行后会返回如下结果,说明执行状态:

+-----------+---------+----------+----------+
| Table     | Op      | Msg_type | Msg_text |
+-----------+---------+----------+----------+
| test.user | analyze | status   | OK       |
+-----------+---------+----------+----------+

统计信息采集的注意事项

  • 采样页数的配置需要平衡准确性和性能,采样页数越多统计信息越准确,但是采集过程的IO消耗也越高,对于大表可以适当调大innodb_stats_persistent_sample_pages的值,但是不建议超过100。
  • 不要在业务高峰期对大表执行ANALYZE TABLE,虽然加的是元数据共享锁,但是采样过程会产生IO消耗,可能影响正常业务的查询性能。
  • 如果发现执行计划异常,可以先检查统计信息是否过时,执行ANALYZE TABLE后再次查看执行计划是否恢复正常。
  • 可以通过查询系统表查看当前的统计信息内容,示例如下:
-- 查看test库user表的统计信息
SELECT * FROM mysql.innodb_table_stats WHERE database_name = 'test' AND table_name = 'user';
-- 查看user表各索引的统计信息
SELECT * FROM mysql.innodb_index_stats WHERE database_name = 'test' AND table_name = 'user';

统计信息与执行计划的关联验证

可以通过对比统计信息采集前后的执行计划,验证统计信息对执行计划的影响。首先查看当前表的统计信息:

-- 查看user表id索引的基数
SELECT index_name, stat_value FROM mysql.innodb_index_stats 
WHERE database_name = 'test' AND table_name = 'user' AND stat_name = 'n_diff_key_vals';

然后执行查询语句查看执行计划:

-- 查看查询的执行计划
EXPLAIN SELECT * FROM test.user WHERE id = 100;

如果后续表数据发生了大量变更,统计信息没有及时更新,再次执行相同的EXPLAIN语句可能会看到执行计划的变化,此时执行ANALYZE TABLE更新统计信息后,执行计划通常会恢复到合理的状态。

MySQLAnalyze_Table执行计划统计信息修改时间:2026-07-02 16:15:32

免责声明:​ 已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰,观点力求客观中立。本站旨在免费分享,内容仅供个人学习、研究或参考使用。若引用了第三方作品,版权归原作者所有。如内容涉及您的权益,请联系我们处理。
内容垂直聚焦
专注技术核心技术栏目,确保每篇文章深度聚焦于实用技能。从代码技巧到架构设计,为用户提供无干扰的纯技术知识沉淀,精准满足专业提升需求。
知识结构清晰
覆盖从开发到部署的全链路。AI、前端、编程、数据库、服务器、建站、系统层层递进,构建清晰学习路径,帮助用户系统化掌握开发与运维所需的核心技术。
深度技术解析
拒绝泛泛而谈,深入技术细节与实践难点。无论是数据库优化还是服务器配置,均结合真实场景与代码示例进行剖析,致力于提供可直接应用于工作的解决方案。
专业领域覆盖
精准对应开发生命周期。从前端界面到后端编程,从数据库操作到服务器运维,形成完整闭环,一站式满足全栈工程师和运维人员的技术需求。
即学即用高效
内容强调实操性,步骤清晰、代码完整。用户可根据教程直接复现和应用于自身项目,显著缩短从学习到实践的距离,快速解决开发中的具体问题。
持续更新保障
专注既定技术方向进行长期、稳定的内容输出。确保各栏目技术文章持续更新迭代,紧跟主流技术发展趋势,为用户提供经久不衰的学习价值。