导读:本期聚焦于小伙伴创作的《Flask如何实现类似ChatGPT的实时流式响应?》,敬请观看详情,探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《Flask如何实现类似ChatGPT的实时流式响应?》有用,将其分享出去将是对创作者最好的鼓励。

在开发对话类应用时,类似ChatGPT的流式响应能极大提升用户体验,用户不需要等待所有内容生成完毕就能看到逐步输出的结果。Flask作为轻量级的Python Web框架,本身就支持流式响应能力,结合合适的通信技术就能实现这个效果。

Flask如何实现类似ChatGPT的实时流式响应?

实现流式响应的核心原理

传统的HTTP响应是一次性返回所有内容,而流式响应要求服务端在处理过程中逐步向客户端发送数据,客户端实时接收并渲染。Flask中可以通过stream_with_context装饰器配合生成器函数实现响应流,而更适合文本流式场景的通信方式是Server-Sent Events(简称SSE),它允许服务端单向向客户端持续推送数据,无需客户端反复请求。

后端Flask实现步骤

1. 基础环境准备

首先需要安装Flask框架,执行以下命令即可:

pip install flask

2. 编写流式响应接口

我们需要定义一个返回SSE格式数据的接口,使用生成器逐步产出内容,同时使用stream_with_context确保请求上下文在流传输过程中可用。以下是完整示例代码:

from flask import Flask, Response, stream_with_context, request
import time

app = Flask(__name__)

# 模拟逐步生成内容的函数,类似大模型逐字输出
def generate_stream_content(prompt):
    # 模拟大模型返回的拆分内容片段
    content_parts = [
        "你好",
        ",我是",
        "基于Flask实现的",
        "流式响应",
        "示例。",
        "当前你输入的内容是:",
        prompt
    ]
    for part in content_parts:
        # 模拟生成每个片段的延迟,模拟真实处理的耗时
        time.sleep(0.5)
        # SSE格式要求每个消息以data:开头,两个换行结束
        yield f"data: {part}\n\n"

@app.route("/stream_chat", methods=["POST"])
def stream_chat():
    prompt = request.form.get("prompt", "")
    # 返回流式响应,设置Content-Type为SSE要求的类型
    return Response(
        stream_with_context(generate_stream_content(prompt)),
        mimetype="text/event-stream"
    )

if __name__ == "__main__":
    app.run(debug=True, port=5000)

3. 代码说明

上面的代码中,generate_stream_content是生成器函数,负责逐步产出内容,每个产出内容都按照SSE的格式包装,即data: 内容\n\n,这样前端才能正确解析。Response对象指定mimetypetext/event-stream,告诉浏览器这是SSE流数据,不要等待全部接收完成再处理。

前端接收流式数据实现

前端可以使用原生的EventSource对象或者普通的fetch API来接收SSE流,以下是使用fetch的实现示例,兼容性更好:

<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <title>Flask流式响应示例</title>
</head>
<body>
    <input type="text" id="promptInput" placeholder="请输入内容" style="width: 300px;">
    <button onclick="sendRequest()">发送</button>
    <div id="result" style="margin-top: 20px; padding: 10px; border: 1px solid #ccc;"></div>

    <script>
        function sendRequest() {
            const prompt = document.getElementById("promptInput").value;
            const resultDiv = document.getElementById("result");
            resultDiv.innerHTML = ""; // 清空之前的结果

            fetch("http://127.0.0.1:5000/stream_chat", {
                method: "POST",
                headers: {
                    "Content-Type": "application/x-www-form-urlencoded"
                },
                body: `prompt=${encodeURIComponent(prompt)}`
            }).then(response => {
                const reader = response.body.getReader();
                const decoder = new TextDecoder();

                // 循环读取流数据
                function readStream() {
                    reader.read().then(({ done, value }) => {
                        if (done) {
                            console.log("流传输结束");
                            return;
                        }
                        // 解码二进制数据为文本
                        const text = decoder.decode(value);
                        // 解析SSE格式的数据,跳过心跳等空消息
                        const lines = text.split("\n").filter(line => line.startsWith("data:"));
                        lines.forEach(line => {
                            const content = line.replace("data: ", "");
                            resultDiv.innerHTML += content;
                        });
                        // 继续读取下一段数据
                        readStream();
                    });
                }
                readStream();
            });
        }
    </script>
</body>
</html>

注意事项

  • 生产环境中需要关闭Flask的debug模式,避免出现流传输异常。
  • 如果使用了反向代理(如Nginx),需要配置代理支持流式传输,避免代理缓冲数据导致流式效果失效,例如Nginx中可以设置proxy_buffering off;
  • SSE是单向通信,只适合服务端向客户端推送数据的场景,如果需要双向通信可以考虑WebSocket,但流式文本输出场景SSE更简单轻量。
提示:如果后端需要对接真实的AI大模型API,只需要把generate_stream_content函数中的模拟内容替换为调用大模型流式接口返回的内容即可,核心的流传输逻辑不需要修改。

Flask流式响应Server-Sent_Events实时通信stream_with_context修改时间:2026-05-31 23:50:27

免责声明:​ 已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰,观点力求客观中立。本站旨在免费分享,内容仅供个人学习、研究或参考使用。若引用了第三方作品,版权归原作者所有。如内容涉及您的权益,请联系我们处理。
内容垂直聚焦
专注技术核心技术栏目,确保每篇文章深度聚焦于实用技能。从代码技巧到架构设计,为用户提供无干扰的纯技术知识沉淀,精准满足专业提升需求。
知识结构清晰
覆盖从开发到部署的全链路。AI、前端、编程、数据库、服务器、建站、系统层层递进,构建清晰学习路径,帮助用户系统化掌握开发与运维所需的核心技术。
深度技术解析
拒绝泛泛而谈,深入技术细节与实践难点。无论是数据库优化还是服务器配置,均结合真实场景与代码示例进行剖析,致力于提供可直接应用于工作的解决方案。
专业领域覆盖
精准对应开发生命周期。从前端界面到后端编程,从数据库操作到服务器运维,形成完整闭环,一站式满足全栈工程师和运维人员的技术需求。
即学即用高效
内容强调实操性,步骤清晰、代码完整。用户可根据教程直接复现和应用于自身项目,显著缩短从学习到实践的距离,快速解决开发中的具体问题。
持续更新保障
专注既定技术方向进行长期、稳定的内容输出。确保各栏目技术文章持续更新迭代,紧跟主流技术发展趋势,为用户提供经久不衰的学习价值。