Temp:温度,单位摄氏度 Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能 Pwr:Usage/Cap:能耗表示 Bus-Id:涉及GPU总线的相关信息; Disp.A:Display Active,表示GPU的显示是否初始化 Memory-Usage:显存使用率 Volatile GPU-Util:浮动的GPU利用率 Uncorr. ECC:关于ECC的东西 Compute M.:计算模式 P...
Temp:显卡内部的温度,单位是摄氏度; Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能; Pwr:能耗表示; Bus-Id:涉及GPU总线的相关信息; Disp.A:是Display Active的意思,表示GPU的显示是否初始化; Memory Usage:显存的使用率; Volatile GPU-Util:浮动的GPU利用率; Compute M:计算模式; 如果要...
Temp 显卡内部的温度,单位是摄氏度 Perf 表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能 Pwr 能耗表示 Bus-Id 涉及GPU总线的相关信息 Disp.A 是Display Active的意思,表示GPU的显示是否初始化 Memory Usage 显存的使用率 Volatile GPU-Util 浮动的GPU利用率 Compute M 计算模式 Processes 下边的Proce...
nvidia-smi:nvidia 的系统管理界面 ,其中smi是System management interface的缩写,它可以收集各种级别的信息,查看显存使用情况。此外, 可以启用和禁用 GPU 配置选项 (如 ECC 内存功能) 参数介绍如下图: 图中参数对应的说明如下: GPU:本机中的GPU编号 Name:GPU 类型 Persistence-M: Fan:风扇转速 Temp:温度,单位摄...
Temp:温度,单位是摄氏度; Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能(即 GPU 未工作时为P0,达到最大工作限度时为P12)。 Pwr:Usage/Cap:能耗; Memory Usage:显存使用率; Bus-Id:涉及GPU总线的东西,domain:bus:device.function;
# p:电源使用情况和温度(pwr:功耗,temp:温度) # u:GPU使用率(sm:流处理器,mem:显存,enc:编码资源,dec:解码资源) # c:GPU处理器和GPU内存时钟频率(mclk:显存频率,pclk:处理器频率) # v:电源和热力异常 # m:FB内存和Bar1内存 # e:ECC错误和PCIe重显错误个数 ...
power.draw:显存功耗,对应Pwr:Usage 上面是显存监控中常用的几个命令,如果还有什么参数想了解,可以通过: nvidia-smi -h命令查看 如果想调整结果记录文件的字段,可以通过下面的命令查看对应的字段: nvidia-smi --help-query-gpu 3 简易测试脚本 nvidia-smi命令会实时记录gpu的情况,如果想让命令停止下来,需要手动执行...
Temp: GPU的温度,这里是26摄氏度。 Perf: 性能状态,这里是P8。GPU的性能状态,从P0(最大性能)到P12(最低性能)不等。 Pwr:Usage/Cap: 当前功率使用和功率上限,这里是9瓦特使用,150瓦特上限。 Memory-Usage: GPU的显存使用情况,这里是0MiB / 23028MiB。
nvidia-smi:查看所有 GPU 的基本信息,包括温度、使用率、显存使用情况等。 nvidia-smi -L:列出所有的 GPU 设备及其 UUID。 nvidia-smi -i [index]:指定查看某个 GPU 的信息,例如 nvidia-smi -i 0 查看0 号 GPU 的信息。 nvidia-smi -i [index] -q:查看指定 GPU 的详细信息,包括其驱动版本、显存大小...