在Linux系统中,nvidia-smi是NVIDIA系统管理接口工具的简称,是管理NVIDIA显卡的核心命令行工具,可查看显卡状态、监控运行进程、调整显卡参数等。掌握其常用命令能有效提升显卡使用效率与问题排查能力。

nvidia-smi基础状态查看命令
最基础的用法是直接执行nvidia-smi命令,可查看所有NVIDIA显卡的实时状态,包含显卡型号、显存占用、温度、功耗、运行进程等信息。
# 直接查看所有显卡状态 nvidia-smi
如果需要持续监控显卡状态,可添加-l参数指定刷新间隔,单位为秒,比如每2秒刷新一次状态:
# 每2秒刷新一次显卡状态 nvidia-smi -l 2
指定显卡与输出格式控制命令
当服务器存在多张NVIDIA显卡时,可通过-i参数指定要查看的显卡编号,编号从0开始:
# 查看编号为0的显卡状态 nvidia-smi -i 0
如果需要将输出结果保存为更易处理的格式,可使用--query-gpu指定要查询的字段,搭配--format指定输出格式,比如输出CSV格式的核心温度、显存占用数据:
# 查询所有显卡的核心温度和显存占用,输出为CSV格式 nvidia-smi --query-gpu=index,temperature.gpu,memory.used --format=csv
进程与显存相关监控命令
要查看当前占用显卡的进程信息,可使用-q参数查询详细信息,再结合| grep过滤进程相关内容:
# 查看显卡详细信息并过滤进程相关内容 nvidia-smi -q | grep -A 5 "Processes"
如果需要查看指定进程的显卡占用情况,可通过进程PID过滤,比如查看PID为1234的进程占用的显卡资源:
# 查看PID为1234的进程对应的显卡占用 nvidia-smi | grep 1234
显卡参数调整命令
可通过nvidia-smi调整显卡的功耗限制,使用-pl参数指定功耗值,单位为瓦,比如将0号显卡功耗限制为250瓦:
# 设置0号显卡功耗限制为250瓦 nvidia-smi -i 0 -pl 250
如果需要调整显卡的持久化模式,避免显卡频繁进入低功耗状态影响性能,可使用-pm参数,1代表开启,0代表关闭:
# 为所有显卡开启持久化模式 nvidia-smi -pm 1
常用命令总结
以下是日常使用频率较高的nvidia-smi命令汇总:
| 命令 | 作用说明 |
|---|---|
nvidia-smi | 查看所有NVIDIA显卡的实时状态 |
nvidia-smi -l 3 | 每3秒刷新一次显卡状态 |
nvidia-smi -i 1 | 查看编号为1的显卡状态 |
nvidia-smi -pl 200 -i 0 | 设置0号显卡功耗限制为200瓦 |
nvidia-smi -pm 1 | 开启所有显卡持久化模式 |
nvidia-smi --query-gpu=memory.used --format=csv | 以CSV格式输出所有显卡的已用显存 |
nvidia-smiLinux显卡监控GPU管理修改时间:2026-06-30 14:00:24