当您执行命令nvidia-smi无法找到GPU显卡时,通常是由于您的GPU实例未安装或者未成功安装NVIDIA驱动。请根据...
tonyyan@tonyyan-X11SPI:~$ nvidia-smi Unable to determine the device handleforGPU0000:65:00.0: GPU is lost. Reboot the system to recover this GPU 327.411fps 3ms312.613fps 3ms309.92fps 3ms300.209fps 2ms342.361fps 3ms322.467fps 3ms316.99fps 3ms318.749fps 3ms321.253fps 3ms314.281fps 3ms312.419...
我这边情况也一样,删了程序和配置文件后还是会重新启动,完全没办法
如果您仍然遇到这个问题,我们的群集上刚刚遇到了同样的问题,“脏”修复方法是:
可以啊~4块3090?不是有pid么?去/dev里查一下?