如何解决Apache服务器下Python CGI脚本的中文乱码问题？

来源：IPIPP.com作者：陈平安头衔：全栈工程师

导读：本期聚焦于小伙伴创作的《如何解决Apache服务器下Python CGI脚本的中文乱码问题？》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《如何解决Apache服务器下Python CGI脚本的中文乱码问题？》有用，将其分享出去将是对创作者最好的鼓励。

Apache 服务器下Python CGI脚本中文乱码问题解决方案

在使用Apache服务器运行Python CGI脚本时，中文乱码是非常常见的问题，通常出现在脚本输出的中文内容无法正常显示，或者接收包含中文的表单请求时出现编码错误。这类问题的核心原因基本都和字符编码的设置、转换有关，下面我们分场景分析并给出对应的解决方法。

一、脚本输出中文乱码问题

当Python CGI脚本直接输出包含中文的内容时，浏览器如果无法正确识别编码，就会显示乱码。这种情况需要从两个方面调整：一是脚本本身的输出编码设置，二是告知浏览器当前内容的编码格式。

1. 设置脚本输出编码

Python3默认使用UTF-8编码，但CGI脚本的输出如果没有显式声明编码，可能会被服务器或浏览器误判为其他编码。我们可以在脚本开头添加编码声明，同时设置标准输出的编码为UTF-8。

# -*- coding: utf-8 -*-
import sys
import io

# 设置标准输出的编码为UTF-8，避免输出时出现编码错误
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')

# 输出内容测试
print("Content-Type: text/html; charset=utf-8\n")  # 告知浏览器编码为UTF-8
print("<html>")
print("<head><meta charset='utf-8'></head>")
print("<body>")
print("<h1>测试中文输出：你好，世界</h1>")
print("</body>")
print("</html>")

上面的代码中，首先通过# -*- coding: utf-8 -*-声明脚本文件本身的编码是UTF-8，避免脚本中中文字符串出现语法错误。然后通过sys.stdout的重定向，让标准输出的编码固定为UTF-8，最后在输出的HTTP头中通过Content-Type字段和HTML的meta标签双重告知浏览器内容使用UTF-8编码，从多个层面避免乱码。

2. 检查Apache的CGI模块配置

如果脚本本身的编码设置正确但依然乱码，需要检查Apache的CGI相关配置，确保服务器没有对输出内容进行额外的编码转换。可以打开Apache的配置文件（通常是httpd.conf或者conf/extra/httpd-cgi.conf），确认CGI脚本的执行配置中没有强制修改输出编码的设置，一般保持默认配置即可，不需要额外添加编码相关的过滤规则。

二、接收请求中文参数乱码问题

当CGI脚本需要处理用户通过表单提交的包含中文的参数时，也可能出现乱码，这种情况通常是因为请求参数的编码和脚本读取时的编码不一致导致的。

1. GET请求参数乱码解决

GET请求的参数会拼接在URL后面，Apache默认会以ISO-8859-1的编码来解析URL中的参数，如果参数包含中文，直接读取就会出现乱码。我们需要先以ISO-8859-1的方式获取原始字节，再转换为UTF-8编码。

# -*- coding: utf-8 -*-
import sys
import io
import urllib.parse

sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
print("Content-Type: text/html; charset=utf-8\n")

# 获取QUERY_STRING环境变量，即GET请求的参数部分
query_string = os.environ.get("QUERY_STRING", "")
# 如果是中文参数，先按ISO-8859-1解码获取原始字节，再转成UTF-8
if query_string:
    # 假设参数是name=中文内容的形式
    params = urllib.parse.parse_qs(query_string)
    # 获取name参数，注意这里先按ISO-8859-1解码再转UTF-8
    raw_name = params.get("name", [""])[0]
    try:
        # 原始字节是ISO-8859-1编码的，转换为UTF-8
        name = raw_name.encode("iso-8859-1").decode("utf-8")
    except:
        name = raw_name
else:
    name = "未接收到参数"

print("<html>")
print("<head><meta charset='utf-8'></head>")
print("<body>")
print(f"<h1>接收到的中文参数：{name}</h1>")
print("</body>")
print("</html>")

上面的代码中，我们通过os.environ.get("QUERY_STRING")获取GET请求的参数字符串，因为Apache传递过来的参数默认是ISO-8859-1编码的字节流，所以先将其编码为ISO-8859-1的字节，再解码为UTF-8，就能得到正确的中文内容。

注意：示例中的os模块需要先导入，完整导入部分应为import os，这里为了突出核心逻辑没有展开，实际使用时请补充导入。

2. POST请求参数乱码解决

POST请求的参数在请求体中，编码通常由表单的accept-charset属性决定，默认一般是UTF-8。读取POST参数时，同样需要注意编码转换的问题。

# -*- coding: utf-8 -*-
import sys
import io
import os
import urllib.parse

sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
print("Content-Type: text/html; charset=utf-8\n")

# 获取POST请求的内容长度
content_length = int(os.environ.get("CONTENT_LENGTH", 0))
if content_length > 0:
    # 读取请求体的原始字节
    post_data = sys.stdin.buffer.read(content_length).decode("iso-8859-1")
    # 解析POST参数
    params = urllib.parse.parse_qs(post_data)
    # 处理中文参数，同样做编码转换
    raw_username = params.get("username", [""])[0]
    try:
        username = raw_username.encode("iso-8859-1").decode("utf-8")
    except:
        username = raw_username
else:
    username = "未接收到POST参数"

print("<html>")
print("<head><meta charset='utf-8'></head>")
print("<body>")
print(f"<h1>接收到的POST中文参数：{username}</h1>")
print("</body>")
print("</html>")

POST请求的处理逻辑和GET类似，区别在于参数读取的来源是标准输入流，并且需要先通过CONTENT_LENGTH环境变量获取请求体的长度，再读取对应长度的字节内容，之后同样做编码转换即可得到正确的中文参数。

三、总结排查步骤

如果遇到中文乱码问题，可以按照以下步骤逐一排查：

第一步：检查Python CGI脚本开头是否添加了# -*- coding: utf-8 -*-编码声明，脚本内的中文字符串是否正常。
第二步：确认脚本是否设置了标准输出编码为UTF-8，是否输出了正确的Content-Type头告知浏览器编码。
第三步：如果是接收参数的场景，检查是否对请求参数做了正确的编码转换，避免ISO-8859-1和UTF-8之间的转换错误。
第四步：检查Apache的配置，确认没有对CGI输出或者请求参数做额外的编码处理规则。

只要覆盖了编码声明、输出设置、参数转换这几个核心环节，基本可以解决Apache下Python CGI脚本的大部分中文乱码问题。

Apache Python_CGI 中文乱码字符编码 GET_POST请求修改时间：2026-05-23 16:38:09

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。