解决PHP中MySQLi查询结果写入JSON文件失败的字符集问题
在PHP开发过程中,我们经常会需要将MySQLi查询到的数据写入JSON文件用于数据缓存、接口输出等场景。但很多开发者会遇到数据写入后乱码、JSON编码失败或者文件内容为空的问题,这类问题大多和字符集设置有关。本文将分析问题原因并提供完整的解决方案。
问题现象
常见的异常表现有以下几种:
查询结果中的中文、特殊符号在JSON文件中显示为乱码
使用
json_encode函数编码数据时返回false,导致写入文件的内容为空JSON文件内容不符合标准格式,无法被其他程序正常解析
问题根源
出现上述问题的核心原因是字符集不匹配,具体包含两类场景:
MySQL数据库使用的字符集不是UTF-8,或者PHP连接数据库时没有指定正确的字符集,导致查询到的数据本身编码异常
PHP的
json_encode函数默认只支持UTF-8编码的数据,如果传入的数据包含非UTF-8编码的字符,就会编码失败
解决方案
要解决这类问题,需要从数据库连接字符集设置和JSON编码处理两个环节入手,以下是完整的实现步骤。
步骤1:设置MySQLi连接字符集
在建立MySQLi连接之后,需要显式设置客户端字符集为UTF-8,确保从数据库查询到的数据已经是UTF-8编码。可以通过set_charset方法实现:
<?php
// 建立数据库连接
$mysqli = new mysqli('localhost', 'root', 'password', 'test_db');
// 检查连接是否成功
if ($mysqli->connect_error) {
die('数据库连接失败:' . $mysqli->connect_error);
}
// 设置字符集为UTF-8
if (!$mysqli->set_charset('utf8mb4')) {
die('设置字符集失败:' . $mysqli->error);
}
?>这里建议使用utf8mb4而不是utf8,因为utf8mb4支持完整的Unicode字符,包括emoji和部分生僻汉字,而MySQL的utf8字符集只支持最多3字节的字符,存在兼容性问题。
步骤2:查询数据并处理编码
执行查询后,需要对结果集中的数据进行编码确认,如果存在非UTF-8的字符,需要先进行转码处理:
<?php
// 执行查询
$sql = 'SELECT id, title, content FROM articles LIMIT 10';
$result = $mysqli->query($sql);
if (!$result) {
die('查询失败:' . $mysqli->error);
}
// 存储查询结果的数组
$data = [];
// 遍历结果集
while ($row = $result->fetch_assoc()) {
// 如果数据不是UTF-8编码,这里可以根据实际情况调整转码逻辑
// 通常设置连接字符集后不需要额外转码,此处作为兜底处理
foreach ($row as $key => $value) {
if (!mb_check_encoding($value, 'UTF-8')) {
$row[$key] = mb_convert_encoding($value, 'UTF-8', '原编码(如GBK)');
}
}
$data[] = $row;
}
// 释放结果集
$result->free();
?>步骤3:正确编码JSON并写入文件
使用json_encode时,建议添加JSON_UNESCAPED_UNICODE参数,避免中文被编码为Unicode转义字符,同时可以添加JSON_PRETTY_PRINT参数让生成的JSON文件格式更易读:
<?php
// 编码数据为JSON格式
$jsonContent = json_encode($data, JSON_UNESCAPED_UNICODE | JSON_PRETTY_PRINT);
// 检查编码是否成功
if (json_last_error() !== JSON_ERROR_NONE) {
die('JSON编码失败:' . json_last_error_msg());
}
// 写入JSON文件
$filePath = 'data.json';
if (file_put_contents($filePath, $jsonContent) === false) {
die('写入文件失败');
}
echo '数据写入成功,文件路径:' . $filePath;
// 关闭数据库连接
$mysqli->close();
?>调试技巧
如果仍然遇到问题,可以通过以下方式排查:
使用
mb_detect_encoding函数检测查询到的数据编码,确认是否为UTF-8打印
json_last_error_msg()的返回值,查看JSON编码失败的具体原因检查数据库表的字符集设置,确保表和字段的字符集也是
utf8mb4
总结
PHP中MySQLi查询结果写入JSON文件乱码或失败的问题,本质是字符集不匹配导致的。只需要在连接数据库时设置正确的utf8mb4字符集,确保查询到的数据是UTF-8编码,再配合正确的json_encode参数,就可以稳定地生成合法的JSON文件。如果要查看示例网站的相关实现,可以访问https://www.ipipp.com查看对应的代码演示。