mysql默认的字符集很多时候是latin1或者utf8,其中utf8在mysql中实际是utf8mb3,只支持最多三字节的字符,无法存储emoji等四字节字符,因此将server端字符集设置为utf8mb4是很有必要的,这样可以覆盖所有常用的字符存储场景。

mysql server端字符集配置步骤
1. 修改配置文件
mysql的server端编码配置主要通过配置文件实现,不同系统的配置文件路径有所不同:Linux系统通常是/etc/my.cnf或者/etc/mysql/my.cnf,Windows系统通常是mysql安装目录下的my.ini。
我们需要在配置文件中添加或修改以下配置项,分别在[client]、[mysql]、[mysqld]三个区块下添加对应内容:
[client] # 客户端默认字符集 default-character-set=utf8mb4 [mysql] # mysql命令行客户端默认字符集 default-character-set=utf8mb4 [mysqld] # 服务端默认字符集 character-set-server=utf8mb4 # 服务端默认排序规则,utf8mb4_general_ci是通用不区分大小写的排序规则 collation-server=utf8mb4_general_ci # 禁止sql模式中的严格字符长度校验,避免部分旧程序报错 sql_mode=NO_ENGINE_SUBSTITUTION,STRICT_TRANS_TABLES
2. 重启mysql服务
修改完配置文件后,需要重启mysql服务让配置生效,不同系统的重启命令如下:
- Linux系统使用systemctl管理的情况:
systemctl restart mysqld - Linux系统使用service管理的情况:
service mysql restart - Windows系统:在服务列表中找到mysql服务,右键选择重启,或者命令行执行
net stop mysql & net start mysql
3. 验证配置是否生效
重启服务后,可以登录mysql执行以下命令查看字符集配置:
-- 查看server端字符集相关变量 SHOW VARIABLES LIKE 'character%'; SHOW VARIABLES LIKE 'collation%';
如果配置生效,输出结果中character_set_server和character_set_database的值应该都是utf8mb4,collation_server和collation_database的值应该是utf8mb4_general_ci或者你配置的其他utf8mb4排序规则。
已有数据库和表的字符集调整
如果之前已经有创建好的数据库或者表使用的是其他字符集,单独修改server端配置不会影响已有的库表,需要手动调整:
调整数据库字符集
-- 修改已有数据库的字符集,db_name替换为实际数据库名 ALTER DATABASE db_name CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
调整表的字符集
-- 修改已有表的字符集,table_name替换为实际表名 ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
连接时的字符集设置
即使server端已经配置了utf8mb4,部分客户端连接时如果没有指定字符集,还是可能出现乱码,因此在连接mysql时建议显式指定字符集为utf8mb4,以下是不同语言的示例:
PHP连接示例
<?php
// 创建连接时指定字符集
$conn = new mysqli('127.0.0.1', 'username', 'password', 'db_name');
// 设置字符集为utf8mb4
$conn->set_charset('utf8mb4');
?>
Java连接示例
import java.sql.Connection;
import java.sql.DriverManager;
public class MysqlConnect {
public static void main(String[] args) throws Exception {
// 连接url中指定字符集参数
String url = "jdbc:mysql://127.0.0.1:3306/db_name?useUnicode=true&characterEncoding=utf8mb4";
String username = "username";
String password = "password";
Connection conn = DriverManager.getConnection(url, username, password);
}
}
常见问题说明
- 为什么不直接用utf8:mysql中的utf8是utf8mb3,最多支持三字节字符,无法存储emoji、部分生僻汉字等四字节字符,utf8mb4才是完整的utf8实现。
- 排序规则怎么选:
utf8mb4_general_ci是通用排序规则,性能较好,不区分大小写;如果需要区分大小写可以选择utf8mb4_bin,如果有特殊语言排序需求可以选择对应的语言排序规则。 - 配置后还是乱码:检查客户端连接时是否指定了字符集,已有的库表是否已经调整为utf8mb4字符集,不要遗漏这两个环节。
mysqlutf8mb4server端编码配置字符集设置修改时间:2026-07-01 11:06:31