服务器——“查询不到显卡驱动,且输入nvidia-smi报错”的解决办法
一、报错内容:
nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
二、原因之一:
驱动模块没有被正确加载或当前内核与驱动不兼容。
三、详细的检查:
在服务器终端,输入以下检查命令:
uname -a
lsb_release -a
nvidia-smi
dpkg -l | grep nvidia
lsmod | grep nvidia
将这些命令的输入一次性全部送入chatgpt,让chatgpt分析,然后确定最终的解决方案。
四、样例
博主将这些命令的输入一次性全部送入chatgpt后,下面是chatgpt的回复:
目前的问题是:
你当前的内核
6.14.0-27-generic
没有对应的 NVIDIA 内核模块,导致驱动未加载。
🧭 备选方案:回滚内核到 6.11.0-29
如果上面步骤失败,或编译失败,你也可以直接回滚内核:
-
查看是否已经安装旧内核:
dpkg --list | grep linux-image
如果有
linux-image-6.11.0-29-generic
说明可以使用。 -
设置默认启动旧内核(无需显示器):
编辑 grub:sudo nano /etc/default/grub
把这两行改为如下(注意版本号):
GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 6.11.0-29-generic" GRUB_TIMEOUT=2
-
更新 grub 并重启:
sudo update-grub sudo reboot
五、小贴士
在使用命令:
sudo nano /etc/default/grub
编辑 grub 文件时,是用 nano 编辑器 打开的。
✅ 在 nano 中退出并保存的方法如下:
🖊 如果你修改了内容并想保存退出:
-
按下
Ctrl + O
(即同时按下Ctrl
和字母O
)
→ 会提示你 “File Name to Write: /etc/default/grub” -
直接按
Enter
回车(确认保存) -
然后按下
Ctrl + X
退出编辑器
❌ 如果你不想保存修改,直接退出:
- 直接按下:
Ctrl + X
- 然后当它问你 “Save modified buffer (ANSWERING “No” WILL DESTROY CHANGES)?”
→ 输入N
(代表 No,不保存)即可退出