在Linux系统中,进程重复运行是运维和开发过程中经常遇到的场景,比如定时任务脚本被多次触发、后台服务启动多个实例,这类问题会占用额外的CPU和内存资源,严重时还可能导致数据写入冲突、服务响应异常。解决这类问题的核心是提前检测进程是否已经在运行,若存在则阻止新的实例启动。

常见进程重复运行的原因
进程重复运行的诱因主要有以下几类:
- 定时任务配置错误,crontab中设置的执行间隔短于脚本实际运行时间,导致上一次任务未结束下一次已经触发
- 服务启动脚本没有做实例检测,手动多次执行启动命令会拉起多个服务进程
- 脚本被多个用户或者多个路径同时调用,没有全局的实例校验逻辑
检测方法一:通过进程名查询判断
最直观的方式是通过ps命令查询当前系统中是否存在目标进程,然后判断进程数量是否超过1。
以下是一个简单的shell脚本示例,检测名为test.sh的脚本是否已经运行:
#!/bin/bash
# 定义目标进程名
PROCESS_NAME="test.sh"
# 查询进程数量,排除当前脚本自身的grep进程
PROCESS_COUNT=$(ps -ef | grep "${PROCESS_NAME}" | grep -v grep | wc -l)
if [ ${PROCESS_COUNT} -gt 1 ]; then
echo "进程 ${PROCESS_NAME} 已经在运行中,无需重复启动"
exit 1
fi
# 以下是脚本原本的业务逻辑
echo "脚本开始执行"
sleep 60
echo "脚本执行结束"
这种方法的缺点是如果进程名存在部分匹配的情况,可能会出现误判,比如有两个脚本分别叫test.sh和test_new.sh,查询test.sh时可能会匹配到后者。
检测方法二:使用pid文件记录进程ID
更可靠的方案是在进程启动时,将自身的进程ID写入一个固定的pid文件,启动前先检查该文件是否存在并且对应的进程是否存活。
实现逻辑如下:
- 进程启动时,先检查/var/run/目录下的对应pid文件是否存在
- 若文件存在,读取其中的PID,通过
ps -p PID判断该进程是否还在运行 - 若进程存活,则退出启动流程;若进程不存在,则删除旧pid文件,写入新的PID
- 进程退出时,删除对应的pid文件
对应的shell脚本示例:
#!/bin/bash
# 定义pid文件路径
PID_FILE="/var/run/test_script.pid"
# 检查pid文件是否存在
if [ -f "${PID_FILE}" ]; then
OLD_PID=$(cat ${PID_FILE})
# 判断旧PID对应的进程是否存活
if ps -p ${OLD_PID} > /dev/null 2>&1; then
echo "进程已经在运行中,PID为 ${OLD_PID}"
exit 1
else
# 旧进程不存在,删除无效pid文件
rm -f ${PID_FILE}
fi
fi
# 写入当前进程PID到文件
echo $$ > ${PID_FILE}
# 注册退出陷阱,确保进程退出时删除pid文件
trap "rm -f ${PID_FILE}; exit" INT TERM EXIT
# 以下是脚本原本的业务逻辑
echo "脚本开始执行,当前PID为 $$"
sleep 60
echo "脚本执行结束"
这种方法的准确性更高,避免了进程名匹配的误差,适合需要稳定运行的后台服务场景。
检测方法三:使用文件锁机制
Linux系统提供了flock命令,可以对文件加排他锁,同一时间只有一个进程能持有该锁,利用这个特性也可以实现进程单实例运行。
使用方式非常简单,只需要在启动脚本时加上flock命令即可:
#!/bin/bash
# 使用flock对/var/lock/test_script.lock文件加排他锁
# -n 参数表示非阻塞,若锁已经被占用则直接退出
# -c 后面是要执行的命令
flock -n /var/lock/test_script.lock -c "/bin/bash /path/to/your/test.sh"
# 若锁被占用,flock命令会返回1
if [ $? -ne 0 ]; then
echo "脚本已经在运行中,获取锁失败"
fi
你也可以直接在脚本内部使用flock,示例代码如下:
#!/bin/bash
# 定义锁文件路径
LOCK_FILE="/var/lock/test_script.lock"
# 尝试获取排他锁
exec 200>${LOCK_FILE}
flock -n 200
if [ $? -ne 0 ]; then
echo "获取锁失败,进程已经在运行中"
exit 1
fi
# 以下是脚本原本的业务逻辑
echo "脚本开始执行"
sleep 60
echo "脚本执行结束"
flock机制是系统层面的锁,可靠性很高,而且不需要手动管理pid文件,使用起来更加便捷。
不同方案的适用场景
可以根据实际需求选择合适的方案,以下是不同方案的对比:
| 方案 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|
| 进程名查询 | 实现简单,无需额外文件 | 容易误判,准确性低 | 临时测试、进程名唯一的简单脚本 |
| pid文件记录 | 准确性高,逻辑可控 | 需要手动管理pid文件,进程异常退出可能残留文件 | 长期运行的后台服务、需要自定义检测逻辑的场景 |
| 文件锁机制 | 系统级保障,无需手动清理,可靠性高 | 需要系统支持flock命令,部分嵌入式系统可能缺失 | 生产环境的大部分脚本和服务 |
注意事项
在实际使用时需要注意以下几点:
- pid文件和锁文件的路径建议放在/var/run/或者/var/lock/目录,确保只有root用户或者对应的服务用户有权限读写,避免其他用户篡改
- 使用pid文件方案时,建议注册退出陷阱,确保进程无论正常还是异常退出都能删除pid文件,避免残留无效文件
- 如果脚本是通过crontab定时执行,建议优先选择flock方案,配置简单且可靠性高,避免定时任务叠加执行
通过以上几种方法,基本可以覆盖Linux系统下进程重复运行的大部分场景,大家可以根据自己的实际需求选择合适的方案,从根源上避免重复进程带来的问题。