mysql数据不一致是数据库运维和开发中常见的问题,主要分为主从数据不一致、业务层感知的数据异常、同库不同查询场景下结果不一致等几类情况,不同类型的异常排查方向存在差异,需要结合具体场景逐步定位。

常见数据不一致场景分类
首先需要对数据不一致的场景做初步判断,常见场景如下:
- 主从架构下,从库数据和主库数据存在差异,从库查询到的数据和主库不同
- 同一事务内多次查询同一条数据,返回结果不一致
- 业务写入的数据和数据库中实际存储的内容不匹配,存在缺失、篡改情况
- 批量操作后,部分数据生效部分数据未生效,整体数据状态不符合预期
主从数据不一致排查思路
1. 检查主从同步状态
首先登录从库执行以下命令查看同步状态:
SHOW SLAVE STATUSG
重点关注两个字段:Slave_IO_Running和Slave_SQL_Running,如果两个值都是Yes,说明同步进程正常运行;如果为No,需要先解决同步中断问题。常见的中断原因包括主从server-id冲突、binlog文件损坏、从库执行sql报错等。
2. 检查binlog同步进度
对比主库的binlog位置和从库已同步的binlog位置,确认是否存在延迟:
-- 主库执行,查看当前binlog信息 SHOW MASTER STATUS; -- 从库执行,查看已同步的binlog信息 SHOW SLAVE STATUSG
如果主库的Position远大于从库读取的Read_Master_Log_Pos,说明存在主从延迟,可能是从库性能不足、大事务写入导致,需要针对性优化。
3. 校验数据差异
可以使用mysql自带的pt-table-checksum工具校验主从数据差异,也可以手动抽样对比关键表的数据:
-- 主库查询某条数据的校验值
SELECT MD5(CONCAT_WS(',', id, name, age)) AS data_md5 FROM test_table WHERE id = 1;
-- 从库执行相同语句,对比md5值是否一致
同库数据不一致排查思路
1. 检查事务隔离级别
mysql的事务隔离级别会影响查询结果的可见性,先查看当前会话和全局的隔离级别:
-- 查看全局事务隔离级别 SELECT @@GLOBAL.tx_isolation; -- 查看当前会话事务隔离级别 SELECT @@SESSION.tx_isolation;
如果是可重复读隔离级别,事务开启后查询到的数据是快照数据,不会读到其他事务已提交的修改,这是符合预期的隔离特性,需要确认是否是业务误用了隔离级别导致感知到数据不一致。
2. 检查是否存在未提交事务
如果有长事务未提交,可能会导致写入的数据暂时不可见,或者锁住了相关记录导致其他写入异常:
-- 查看当前运行的事务 SELECT * FROM information_schema.innodb_trx;
如果存在长时间运行的事务,需要确认其是否正常,必要时可以手动提交或回滚。
3. 检查写入逻辑和触发器
确认业务层的写入逻辑是否正确,是否存在部分写入后未提交、异常回滚的情况。同时检查表上是否有触发器,触发器的逻辑是否会修改其他表的数据,导致整体数据状态不符合预期。
数据修复与预防建议
定位到不一致的原因后,可以根据场景修复数据:主从不一致可以重新同步全量数据,或者手动补全差异数据;同库数据异常可以回滚错误事务,重新执行正确的写入逻辑。
预防层面建议做好以下几点:主从架构下定期校验数据一致性,避免大事务写入减少主从延迟,业务层写入操作做好异常捕获和事务管理,重要数据操作保留操作日志方便回溯。