在Apache服务器上运行Python CGI脚本时,中文显示乱码是部署过程中非常常见的问题,核心原因大多是字符编码没有统一匹配,涉及服务器配置、脚本编码、响应头设置等多个环节。

常见乱码原因解析
1. Python脚本未声明编码
Python 2和Python 3的默认编码不同,如果脚本中没有显式声明编码,解释器可能会使用系统默认编码解析脚本内容。当脚本中包含中文时,解析错误就会导致输出乱码。
2. 未设置正确的HTTP响应头
CGI脚本需要通过响应头告诉浏览器返回内容的编码格式,如果没有设置Content-Type的charset参数,浏览器会使用默认编码解析内容,很容易出现中文乱码。
3. Apache服务器配置编码不匹配
Apache服务器本身可能有默认的字符编码配置,如果和脚本输出的编码不一致,服务器可能会对输出内容做转码处理,进而引发乱码问题。
4. 脚本输出内容编码不一致
如果脚本中部分中文是从文件、数据库读取的,这些来源的编码和脚本输出编码不一致,也会导致最终展示的中文出现乱码。
对应解决方法
第一步:声明Python脚本编码
在Python脚本的第一行或者第二行添加编码声明,指定脚本使用UTF-8编码,避免解释器解析脚本时出现错误。
# -*- coding: utf-8 -*-
# 或者
# coding: utf-8
print("Content-Type: text/html; charset=utf-8\n")
print("<html><body>测试中文输出</body></html>")第二步:设置正确的HTTP响应头
CGI脚本输出内容前,必须先输出正确的响应头,指定内容的编码为UTF-8,确保浏览器用对应编码解析内容。
# -*- coding: utf-8 -*-
# 输出响应头,必须带两个换行,第一个换行结束响应头,第二个换行分隔响应头和正文
print("Content-Type: text/html; charset=utf-8")
print()
# 输出正文内容
print("<h1>这是中文标题</h1>")
print("<p>这是中文段落内容,测试是否正常显示</p>")第三步:调整Apache服务器配置
修改Apache的配置文件(通常是httpd.conf或者conf.d目录下的配置文件),添加或修改字符编码相关的配置,确保服务器不会错误转码CGI输出内容。
# 设置默认字符编码为UTF-8
AddDefaultCharset UTF-8
# 针对CGI脚本单独设置编码(如果存在特殊配置)
<Directory "/var/www/cgi-bin">
Options +ExecCGI
AddHandler cgi-script .cgi .py
# 强制该目录下的输出使用UTF-8编码
ForceType text/html;charset=utf-8
</Directory>第四步:统一外部数据编码
如果脚本需要读取外部文件或者数据库内容,需要先将这些内容的编码转换为UTF-8再输出,避免编码不一致导致乱码。
# -*- coding: utf-8 -*-
import codecs
print("Content-Type: text/html; charset=utf-8")
print()
# 读取GBK编码的文件,转换为UTF-8输出
with codecs.open("test.txt", "r", encoding="gbk") as f:
content = f.read()
print("<p>文件内容:{}</p>".format(content))验证方法
完成上述配置后,可以通过浏览器的开发者工具查看响应头,确认Content-Type中的charset是UTF-8,同时查看页面内容是否正常显示中文。如果还是出现乱码,可以检查脚本文件本身的保存编码是否为UTF-8,以及Apache配置是否生效。
注意:修改Apache配置后需要重启服务器才能生效,不同系统的重启命令不同,Linux系统通常使用systemctl restart httpd或者service apache2 restart,Windows系统可以通过服务管理器重启Apache服务。