1. 问题表现前段时间,因为其它事情忙,有一段时间没有使用AI服务器上的GPU资料。发现 cuda不可用,于是输入“nvidia-smi”才发现了一个错误,如下:nvidia-smi NVIDIA-SMI has failed because it couldn't co…
1、执行nvidia-smi出现问题: root@amax:~$ nvidia-smi NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running. 2、常见的可能性是ubuntu内核版本和nvidia驱动版本不匹配,ubuntu重启时内核版本自动升级造成了(but我确实...
3. 重启大法:有时候,重启系统可以解决一些临时性的问题。重启系统后,再次运行nvidia-smi命令,看看问题...
首先,根据提示安装推荐的NVIDIA驱动。执行命令后,系统将推荐安装特定的软件包,通常包括"recommended"字样的标签。在安装完成后,再次尝试使用nvidia-smi命令。若问题仍未解决,可继续进行手动编译安装。在root权限下执行以下步骤:1. 进入当前使用的内核源码目录,并将当前内核配置文件复制到内核源码路径。无...
在遇到此类问题时,建议首先检查GPU硬件是否正常连接和工作,确保没有物理损伤。其次,检查驱动程序是否过时或与系统不兼容,尝试更新或回滚驱动程序。此外,检查GPU管理软件(如NVIDIA GeForce Experience)是否已正确安装并配置。解决NVIDIA-SMI报错的关键在于确保GPU被正确识别和启用,同时系统和驱动程序保持最新...
会得到提示:nvidia-smi不是内部或外部命令,也不是可运行的程序或批处理文件。 注:其实安装NVIDIA控制面板时,软件已内置安装了nvidia-smi.exe,我们只需把相关路径添加到环境变量中即可使用相关功能。 2. 解决办法 2.1 查找路径 nvidia-smi.exe默认安装路径(也可根据自己的实际安装路径查找): ...
服务器上的nvidia显卡驱动用的好好的,突然有一天,服务器断电了,然后恢复之后发现常用的nvidia-smi命令无法使用了,具体显示什么无法建立和驱动器的通信之类的,上网查了一堆,发现问题的核心:linux服务器重启之后有时候内核更新了,这时候系统会自动更新内核,那么原来的nvidia驱动器的版本就跟不上内核的版本了。自己设置启...
系统升级导致内核改变,并可能导致它与显卡驱动不再匹配,所以在开机后屏幕分辨率明显出现问题,如果使用 nvidia-smi 命令会出现以下错误: NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver 解决: 1. 首先进入 ubuntu 的 GRUB 界面(注:本机只安装了 Ubuntu 系统),进入方法自行搜索; 2...