MySQL读写分离架构中,从库读取旧数据是常见问题,本质原因是主从复制存在延迟,主库执行写操作后,binlog同步到从库并回放需要一定时间,这段时间内从库的数据就会比主库旧。要解决这个问题,开启从库强一致性读取模式是有效方案之一。

从库读取旧数据的核心原因
MySQL主从复制的流程是主库写数据生成binlog,从库IO线程拉取binlog到本地中继日志,SQL线程回放中继日志完成数据同步。这个流程是异步的,主库提交事务后不会等待从库同步完成,所以必然存在延迟窗口。常见的延迟诱因包括:
- 主库写操作并发高,binlog生成速度快,从库回放速度跟不上
- 从库硬件配置比主库低,CPU、磁盘IO性能不足
- 从库上运行了大查询,占用了SQL线程的资源,拖慢回放速度
- 网络延迟导致从库拉取binlog的速度变慢
从库强一致性读取的实现原理
强一致性读取要求读取从库数据时,必须确保数据已经和主库同步完成,不会出现过期数据。MySQL提供的semi-sync半同步复制机制是开启强一致性读取的基础,半同步复制要求主库提交事务时,至少等待一个从库接收并写入中继日志后,才给客户端返回成功,大幅降低了主从延迟的概率。
在半同步复制的基础上,结合从库的gtid全局事务ID机制,读取时可以先确认从库的GTID集合是否已经包含了主库最新的事务GTID,确认后再执行查询,就能保证读取到最新的数据。
开启从库强一致性读取的具体步骤
1. 开启半同步复制
首先主从库都需要安装半同步复制插件,然后开启半同步复制功能。
主库执行以下命令:
-- 安装半同步复制主库插件 INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so'; -- 开启主库半同步复制 SET GLOBAL rpl_semi_sync_master_enabled = 1; -- 设置主库等待从库ACK的超时时间,单位毫秒,默认10000 SET GLOBAL rpl_semi_sync_master_timeout = 3000; -- 查看主库半同步状态 SHOW STATUS LIKE 'Rpl_semi_sync_master_status';
从库执行以下命令:
-- 安装半同步复制从库插件 INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so'; -- 开启从库半同步复制 SET GLOBAL rpl_semi_sync_slave_enabled = 1; -- 重启从库IO线程让配置生效 STOP SLAVE IO_THREAD; START SLAVE IO_THREAD; -- 查看从库半同步状态 SHOW STATUS LIKE 'Rpl_semi_sync_slave_status';
2. 开启GTID模式
GTID模式可以让事务有全局唯一的标识,方便判断从库是否同步了指定事务。主从库的配置文件my.cnf中添加以下配置,然后重启MySQL服务:
[mysqld] gtid_mode=ON enforce_gtid_consistency=ON
重启后查看GTID状态:
-- 查看是否开启GTID SHOW GLOBAL VARIABLES LIKE 'gtid_mode'; -- 查看当前实例的GTID集合 SELECT @@GLOBAL.gtid_executed;
3. 业务层实现强一致性读取逻辑
业务查询从库前,先获取主库最新的GTID,然后等待从库同步到该GTID后再查询。以下是Java语言的实现示例:
import java.sql.*;
public class ConsistencyReadUtil {
// 主库连接
private Connection masterConn;
// 从库连接
private Connection slaveConn;
/**
* 获取主库最新的GTID
*/
public String getMasterLatestGtid() throws SQLException {
Statement stmt = masterConn.createStatement();
ResultSet rs = stmt.executeQuery("SELECT @@GLOBAL.gtid_executed");
if (rs.next()) {
return rs.getString(1);
}
throw new SQLException("获取主库GTID失败");
}
/**
* 等待从库同步到指定的GTID
* @param targetGtid 目标GTID
* @param timeout 超时时间,单位秒
*/
public void waitSlaveSyncGtid(String targetGtid, int timeout) throws SQLException {
long start = System.currentTimeMillis();
while (true) {
Statement stmt = slaveConn.createStatement();
ResultSet rs = stmt.executeQuery("SELECT GTID_SUBSET('" + targetGtid + "', @@GLOBAL.gtid_executed)");
if (rs.next() && rs.getInt(1) == 1) {
// 从库已经包含目标GTID,同步完成
return;
}
if (System.currentTimeMillis() - start > timeout * 1000L) {
throw new RuntimeException("等待从库同步超时");
}
try {
Thread.sleep(100);
} catch (InterruptedException e) {
Thread.currentThread().interrupt();
throw new RuntimeException(e);
}
}
}
/**
* 强一致性查询从库
*/
public void consistencyQueryFromSlave(String sql) throws SQLException {
// 获取主库最新GTID
String latestGtid = getMasterLatestGtid();
// 等待从库同步
waitSlaveSyncGtid(latestGtid, 3);
// 执行从库查询
Statement stmt = slaveConn.createStatement();
ResultSet rs = stmt.executeQuery(sql);
// 处理结果集逻辑
}
}
相关优化建议
- 半同步复制的超时时间不要设置过长,避免主库写操作阻塞太久,默认10000毫秒可以根据业务调整
- 从库尽量和主库使用相同的硬件配置,避免从库性能不足导致回放延迟
- 从库上尽量不要运行大批量查询或者分析类任务,避免占用SQL线程资源
- 如果业务对一致性要求不是特别高,也可以采用写操作后直接读主库,其他读操作读从库的方案,减少强一致性读取的性能损耗
注意:强一致性读取会增加读操作的延迟,因为需要等待从库同步完成,需要根据业务的实际一致性要求和性能要求做权衡。