停掉 所有 在显卡上运行的程序, ERR会消失设置显卡的persistence mode, 按照这个教程.限制最大的运行功率不要太大sudo nvidia-smi -pl 200 -i 2 # 指定卡2的最大功率为200 再次运行nvidia-smi显示卡2的运行功率已经调整好了 注: 单独跑一个程序的时候, 200W的功率已经足够了, 可缓解产热过多的问题. 其他...
问题分析在显卡上长时间运行很多的程序, 导致显卡过热, 出现问题.解决方法停掉所有的在显卡上运行的程序, ERR会消失设置显卡的persistence mode, 按照这个教程.限制最大的运行功率不要太大sudo nvidia-smi -pl 200 -i 2 # 指定卡2的最大功率为200再次运行nvidia-smi显示卡2的运行功率已经调整好了+---... 声...
显卡散热异常、风扇损坏。显卡温度过高,影响用户业务。执行nvidia-smi命令,查看风扇是否正常。如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障信息收集收集故障信息后联系技术支持检查硬件是否存在问题。如果风扇显示ERR!,可能是因为显
还有一个问题是有时候GPU过热会导致风扇停转,GPU Fan显示ERR!,但是GPU上的程序并没有停止(结果导致GPU发热更严重了),这时候应尽快kill改卡上的程序: kill -PID # PID为改卡上的程序编号 然后reset GPU: nvidia-smi -r 然后限制GPU的功率,防止GPU过热: sudo nvidia-smi -pm 1 # 把GPU的persistent mode(常...
大家好,我在Windows下使用nvidia-smi -pl 命令尝试降低1080TI显卡功率上限,分别设置为125W(最低), 250W(默认)和300W(最高)。运行高负载的深度学习程序,发现下图所示的结果: 2161 linux吧 无字炎黄 求助如图:装有4张显卡,nvidia-smi只显示3张,可能的原因是什么 1165 tensorflow吧 紫霄云亭 nvidia-smi显示gpu被...
(需要图的话,明天可以补) 具体困局如下:按现在所知,关闭独显无法进入图形化桌面,这样可以使用GPU加速,使用核显,大概可以进入图形化桌面,但 分享2512 图那丁吧 zzbazinga tesla p40 nvidia-smi显示ERR!/250W操作系统win11和Ubuntu都试了,驱动也都试了很多版本,主板是山寨x99,cpu是e5 2666v3,不知道哪里的问题,哪位...