红色区域是执行状态参数,包括GPU型号、风扇、温度、性能状态、电源使用情况等,这些都是监控GPU健康和性能的宝贵数据。绿色区域则展示了正在运行的CUDA程序状态,特别是PID和GPU内存使用率,这些对于理解程序运行情况至关重要。此外,nvidia-smi指令还有更多用法,如快速查询所有GPU信息、特定GPU详情或显存信息。
1)报错详情: # 重启服务器后, grub默认使用最新版本内核,导致 nvidia-smi 报错 NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running. 2)解决办法: 修改grub默认内核为原版本内核 Step1. 查看内核日志,寻找之前...