Temp:温度,单位摄氏度 Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能 Pwr:Usage/Cap:能耗表示 Bus-Id:涉及GPU总线的相关信息; Disp.A:Display Active,表示GPU的显示是否初始化 Memory-Usage:显存使用率 Volatile GPU-Util:浮动的GPU利用率 Uncorr. ECC:关于ECC的东西 Compute M.:计算模式 P...
Temp:显卡内部的温度,单位是摄氏度; Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能; Pwr:能耗表示; Bus-Id:涉及GPU总线的相关信息; Disp.A:是Display Active的意思,表示GPU的显示是否初始化; Memory Usage:显存的使用率; Volatile GPU-Util:浮动的GPU利用率; Compute M:计算模式; 如果要...
Temp 显卡内部的温度,单位是摄氏度 Perf 表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能 Pwr 能耗表示 Bus-Id 涉及GPU总线的相关信息 Disp.A 是Display Active的意思,表示GPU的显示是否初始化 Memory Usage 显存的使用率 Volatile GPU-Util 浮动的GPU利用率 Compute M 计算模式 Processes 下边的Proce...
Fan:风扇转速,从0到100%之间变动; Temp:温度,单位是摄氏度; Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能(即 GPU 未工作时为P0,达到最大工作限度时为P12)。 Pwr:Usage/Cap:能耗; Memory Usage:显存使用率; Bus-Id:涉及GPU总线的东西,domain:bus:device.function; Disp.A:Display Active,...
# p:电源使用情况和温度(pwr:功耗,temp:温度) # u:GPU使用率(sm:流处理器,mem:显存,enc:编码资源,dec:解码资源) # c:GPU处理器和GPU内存时钟频率(mclk:显存频率,pclk:处理器频率) # v:电源和热力异常 # m:FB内存和Bar1内存 # e:ECC错误和PCIe重显错误个数 ...
power.draw:显存功耗,对应Pwr:Usage 上面是显存监控中常用的几个命令,如果还有什么参数想了解,可以通过: nvidia-smi -h命令查看 如果想调整结果记录文件的字段,可以通过下面的命令查看对应的字段: nvidia-smi --help-query-gpu 3 简易测试脚本 nvidia-smi命令会实时记录gpu的情况,如果想让命令停止下来,需要手动执行...
Temp: GPU的温度,这里是26摄氏度。 Perf: 性能状态,这里是P8。GPU的性能状态,从P0(最大性能)到P12(最低性能)不等。 Pwr:Usage/Cap: 当前功率使用和功率上限,这里是9瓦特使用,150瓦特上限。 Memory-Usage: GPU的显存使用情况,这里是0MiB / 23028MiB。
Processes:显示每个进程占用的显存使用率、进程号、占用的哪个GPU 通过Linux 系统查看 Nvidia GPU 的系统管理界面(System Management Interface, SMI),其他操作系统类似。 nvidia-smi 2.nvidia-smi常用选项 可以通过 nvidia-smi --help 命令查看完整的选项列表和用法说明。
nvidia-smi:查看所有 GPU 的基本信息,包括温度、使用率、显存使用情况等。 nvidia-smi -L:列出所有的 GPU 设备及其 UUID。 nvidia-smi -i [index]:指定查看某个 GPU 的信息,例如 nvidia-smi -i 0 查看0 号 GPU 的信息。 nvidia-smi -i [index] -q:查看指定 GPU 的详细信息,包括其驱动版本、显存大小...