在线上服务迭代过程中,服务升级时如果直接重启进程,会导致正在处理的请求被中断,用户会感知到服务不可用。使用Golang实现应用的滚动更新和平滑升级,能够在不停止服务的前提下完成版本替换,保障业务连续性。

平滑升级核心原理
平滑升级的核心是新旧进程交替工作,流程如下:
- 新版本进程启动后,监听和旧进程相同的端口
- 旧进程停止接收新的请求,等待已经接收的请求处理完成
- 新进程接管所有新的请求,旧进程退出
Golang中可以通过信号处理、子进程管理、文件描述符传递来实现这个流程,其中syscall包和os/signal包是关键工具。
基础实现步骤
1. 监听升级信号
首先在服务中监听指定的升级信号,比如SIGUSR2,当收到信号时触发升级流程。
package main
import (
"fmt"
"net/http"
"os"
"os/signal"
"syscall"
"time"
)
func main() {
// 启动HTTP服务
server := &http.Server{Addr: ":8080"}
http.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) {
fmt.Fprintf(w, "当前版本: v1.0, 处理时间: %s", time.Now().Format("15:04:05"))
})
go func() {
if err := server.ListenAndServe(); err != nil && err != http.ErrServerClosed {
fmt.Printf("服务启动失败: %vn", err)
}
}()
// 监听升级信号
sigChan := make(chan os.Signal, 1)
signal.Notify(sigChan, syscall.SIGUSR2)
<-sigChan
fmt.Println("收到升级信号,开始执行平滑升级")
// 触发升级逻辑
startNewProcess()
// 旧进程优雅关闭
server.Shutdown(nil)
}
2. 启动新进程并传递监听的文件描述符
旧进程收到升级信号后,需要启动新版本的进程,并且把当前监听的socket文件描述符传递给新进程,这样新进程才能复用同一个端口,避免端口占用冲突。
func startNewProcess() {
// 获取当前监听的文件描述符
listener, err := net.FileListener(f)
if err != nil {
fmt.Printf("获取文件描述符失败: %vn", err)
return
}
// 将文件描述符传递给新进程
fd := listener.(*net.TCPListener).File()
// 启动新进程,传递文件描述符
cmd := exec.Command(os.Args[0], "-graceful")
cmd.Stdout = os.Stdout
cmd.Stderr = os.Stderr
cmd.ExtraFiles = []*os.File{fd}
if err := cmd.Start(); err != nil {
fmt.Printf("启动新进程失败: %vn", err)
}
}
3. 新进程初始化逻辑
新进程启动时需要判断是否是升级场景,如果是则从父进程传递的文件描述符中恢复监听,而不是重新绑定端口。
func initNewProcess() {
// 判断是否是优雅升级场景
if len(os.Args) > 1 && os.Args[1] == "-graceful" {
// 从父进程传递的文件描述符中恢复监听
f := os.NewFile(3, "listener")
listener, err := net.FileListener(f)
if err != nil {
fmt.Printf("恢复监听失败: %vn", err)
return
}
server := &http.Server{}
go func() {
http.Serve(listener, nil)
}()
fmt.Println("新进程已从父进程继承监听,开始处理请求")
} else {
// 正常启动逻辑
// ...
}
}
滚动更新部署流程
在集群环境中实现滚动更新,需要配合负载均衡器逐步替换实例:
- 先将新版本实例部署到集群,但是不接入负载均衡
- 确认新实例健康检查通过后,将负载均衡中一部分旧实例摘除
- 对摘除的旧实例执行平滑升级,升级完成后重新接入负载均衡
- 重复上述步骤直到所有旧实例都升级完成
注意事项
- 升级过程中需要保证新旧版本的接口兼容,避免请求格式不匹配导致报错
- 如果服务依赖外部状态,需要确保新进程能够继承或者重新初始化这些状态
- 升级信号需要根据系统环境选择,比如Windows系统不支持
SIGUSR2,可以使用其他自定义信号 - 旧进程优雅关闭时需要设置合理的超时时间,避免无限等待
平滑升级方案适用于无状态或者状态可恢复的服务,如果服务依赖本地持久化状态,需要额外设计状态同步机制。
完整示例验证
可以编译两个版本的服务,先启动v1版本,然后发送SIGUSR2信号触发升级,升级过程中持续请求服务接口,会发现请求不会出现中断,只会切换返回的版本标识。
# 启动v1版本服务 go run main.go # 另一个终端发送升级信号 kill -USR2 [旧进程PID] # 持续请求验证 curl http://127.0.0.1:8080