MySQL主从复制是数据库层面实现数据冗余、读写分离的核心机制,通过将主库的数据变更同步到从库,既可以分担主库的查询压力,也能在主库故障时快速切换从库提供服务。半同步复制是在传统异步主从复制基础上优化的方案,能够降低主从数据不一致的风险,两者适用场景存在明显差异。

MySQL主从复制的工作原理
传统的主从复制是异步执行的,整个流程依赖三个核心线程和binlog日志实现,具体步骤如下:
- 主库上执行数据变更操作,比如增删改语句,操作会被记录到主库的二进制日志binlog中
- 从库的IO线程连接主库,请求拉取指定位置的binlog日志内容
- 主库收到请求后,由binlog dump线程读取对应的binlog内容,发送给从库的IO线程
- 从库IO线程将接收到的binlog内容写入本地的中继日志relay log
- 从库的SQL线程读取relay log中的内容,解析成具体的SQL语句并在从库上执行,完成数据同步
这种异步模式的优势是主库的写入性能不受从库影响,主库提交事务后不需要等待从库确认,但是缺点也很明显:如果主库提交事务后还没来得及同步binlog就宕机,此时从库没有接收到最新的数据,切换从库后就会出现数据丢失的情况。
半同步复制的核心改进
半同步复制在异步复制的基础上增加了同步确认机制,主库在提交事务时,不会立即给客户端返回成功,而是会等待至少一个从库接收到binlog并写入relay log后,再给客户端返回事务提交成功的响应。具体的工作流程调整如下:
- 主库执行事务提交,将binlog发送给从库,此时主库的事务线程会阻塞等待从库的确认
- 从库IO线程接收到binlog后,写入本地的relay log,然后向主库返回确认收到的信号
- 主库收到至少一个从库的确认信号后,才会完成事务提交,返回结果给客户端
- 如果主库等待超时(默认等待时间是10秒),没有得到从库的确认,半同步复制会自动降级为异步复制,避免影响主库的正常写入
半同步复制保证了主库和至少一个从库的数据是一致的,即使主库宕机,切换到该从库也不会丢失已经提交的事务数据,但是因为需要等待从库确认,主库的写入延迟会比异步复制更高。
两种复制模式的配置示例
主从复制基础配置
首先配置主库的my.cnf文件,开启binlog并设置唯一server-id:
[mysqld] # 开启二进制日志 log-bin=mysql-bin # 设置服务器唯一ID,主从库的ID不能相同 server-id=1 # 设置binlog格式为行模式,兼容性更好 binlog_format=ROW
重启主库后,创建用于从库同步的账号:
-- 创建同步账号,允许从库IP连接 CREATE USER 'repl'@'从库IP' IDENTIFIED BY 'repl_password'; -- 授予复制权限 GRANT REPLICATION SLAVE ON *.* TO 'repl'@'从库IP'; -- 刷新权限 FLUSH PRIVILEGES; -- 查看主库binlog状态,记录File和Position值 SHOW MASTER STATUS;
接着配置从库的my.cnf文件:
[mysqld] # 设置从库唯一ID server-id=2 # 开启中继日志 relay-log=mysql-relay
重启从库后,执行同步命令:
-- 配置主库连接信息,替换对应的主库IP、同步账号、密码、binlog文件和位置 CHANGE MASTER TO MASTER_HOST='主库IP', MASTER_USER='repl', MASTER_PASSWORD='repl_password', MASTER_LOG_FILE='mysql-bin.000001', MASTER_LOG_POS=154; -- 启动从库同步 START SLAVE; -- 查看同步状态,确保Slave_IO_Running和Slave_SQL_Running都是Yes SHOW SLAVE STATUSG
半同步复制配置
半同步复制需要主从库都安装对应的插件,首先在主库安装半同步主库插件:
-- 安装半同步主库插件 INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so'; -- 开启半同步复制 SET GLOBAL rpl_semi_sync_master_enabled = 1; -- 设置等待从库确认的超时时间,单位是毫秒,默认10000即10秒 SET GLOBAL rpl_semi_sync_master_timeout = 10000;
从库安装半同步从库插件:
-- 安装半同步从库插件 INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so'; -- 开启半同步复制 SET GLOBAL rpl_semi_sync_slave_enabled = 1; -- 重启从库的IO线程让配置生效 STOP SLAVE IO_THREAD; START SLAVE IO_THREAD;
配置完成后可以通过以下命令查看半同步状态:
-- 主库查看半同步状态,Rpl_semi_sync_master_status为ON表示开启成功 SHOW STATUS LIKE 'Rpl_semi_sync_master_status'; -- 从库查看半同步状态,Rpl_semi_sync_slave_status为ON表示开启成功 SHOW STATUS LIKE 'Rpl_semi_sync_slave_status';
两种复制模式的选择建议
如果业务对写入性能要求高,能够容忍极低概率的数据丢失,比如普通的互联网业务、日志类业务,优先选择异步主从复制,能够最大化主库的写入能力。
如果业务对数据一致性要求高,比如金融交易、订单类业务,不能容忍已提交事务丢失,那么应该选择半同步复制,虽然会增加一点写入延迟,但是能够保障核心数据的安全。
需要注意的是,半同步复制只是保证至少一个从库接收到binlog,并不保证从库已经执行完事务,所以极端情况下还是可能存在主从数据延迟的问题,需要结合业务场景做对应的优化。