当前位置: 首页 > news >正文

RuntimeError: The NVIDIA driver on your system is too old.

【报错】使用 AutoDL 复现实验时遇到 RuntimeError: The NVIDIA driver on your system is too old (found version 11070). Please update your GPU driver by downloading and installing a new version from the URL: http://www.nvidia.com/Download/index.aspx Alternatively, go to: https://pytorch.org to install a PyTorch version that has been compiled with your version of the CUDA driver. 报错:
在这里插入图片描述
显卡是 RTX 3090 24G,软件环境参照 instruct-pix2pix 的 environment.yaml;

【原因】执行 nvidia-smi 指令获取 GPU 相关信息,包括驱动版本、CUDA 版本和一些设备信息:
在这里插入图片描述

按照报错提示,访问 http://www.nvidia.com/Download/index.aspx 查询合适的 GPU 驱动版本,发现确实是驱动版本太低 1 2,至少需要 535.146.02 版本的驱动程序,而服务器上的仅有 515.76:
在这里插入图片描述

【解决办法】参考 AutoDL私有云 | GPU驱动 更新驱动,但第一部卸载当前驱动无法执行,可以按照 How can I uninstall a nvidia driver completely ? 中卸载驱动。

卸载驱动后,安装新驱动:wget https://us.download.nvidia.com/XFree86/Linux-x86_64/535.98/NVIDIA-Linux-x86_64-535.98.run
在这里插入图片描述

最后一步遇到 ERROR: An NVIDIA kernel module 'nvidia-uvm' appears to already be loaded in your kernel. This may be because it is in use (for example, by an X server, a CUDA program, or the NVIDIA Persistence Daemon), but this may also happen if your kernel was configured without support for module unloading. Please be sure to exit any programs that may be using the GPU(s) before attempting to upgrade your driver. If no GPU-based programs are running, you know that your kernel supports module unloading, and you still receive this message, then an error may have occurred that has corrupted an NVIDIA kernel module's usage count, for which the simplest remedy is to reboot your computer. 报错:
在这里插入图片描述
查阅大量资料也未能解决 3

因为是远程服务器无法本地安装驱动,建议换一台版本更高的。


  1. UserWarning: CUDA initialization: The NVIDIA driver on your system is too old (found version 10010) ↩︎

  2. NVIDIA driver too old error #4546 ↩︎

  3. How to solve ‘ERROR: An NVIDIA kernel module ‘nvidia-uvm’ appears to already be loaded in your kernel’? ↩︎

http://www.lryc.cn/news/271207.html

相关文章:

  • Java开发过程中的幂等性问题
  • 基于Docker的软件环境部署脚本,持续更新~
  • C#上位机与欧姆龙PLC的通信08----开发自己的通讯库读写数据
  • 【Redis技术专区】「原理分析」探讨Redis6.0为何需要启用多线程
  • simulink代码生成(六)——多级中断的配置
  • 【Minikube Prometheus】基于Prometheus Grafana监控由Minikube创建的K8S集群
  • 无需翻墙|Stable Diffusion WebUI 安装|AI绘画
  • 在FC中手工创建虚拟机模板
  • OpenSSL provider
  • pandas处理双周数据
  • 2023结婚成家,2024借势起飞
  • linux SHELL语句
  • 音频修复和增强软件:iZotope RX 10 (Win/Mac)中文汉化版
  • 复试 || 就业day03(2023.12.29)算法篇
  • 处理urllib.request.urlopen报错UnicodeEncodeError:‘ascii‘
  • 数据结构模拟实现LinkedList双向不循环链表
  • 性能优化-如何提高cache命中率
  • 分布式【4. 什么是 CAP?】
  • <软考高项备考>《论文专题 - 39采购管理(3) 》
  • Java在SpringCloud中自定义Gateway负载均衡策略
  • 前端 js 基础(1)
  • Android : 使用GestureOverlayView进行手势识别—简单应用
  • API集群负载统计 (100%用例)C卷 (JavaPythonNode.jsC语言C++)
  • 小梅哥Xilinx FPGA学习笔记18——专用时钟电路 PLL与时钟向导 IP
  • 低代码平台在金融银行中的应用场景
  • Css基础内容
  • 微服务(11)
  • 连锁门店管理需要信息化系统
  • UTF-8编码:打破字符编码的国界
  • HTML进阶