当前位置: 首页 > news >正文

Linux下Nvidia显卡GPU开启驱动持久化

GPU开启驱动持久化的原因

GPU 驱动一直处于加载状态, 减少运行程序时驱动加载的延迟。不开启该模式时,在程序每次调用完 GPU 后, GPU 驱动都会被卸载,下次调用时再重新加载, 驱动频繁卸载加载, GPU 频繁被初始化,会导致 GPU 死机, CPU 访问 PCIe config registers时间过长导致 softlock, 最终造成 GPU 掉卡、温度监测异常等情况。建议打开GPU驱动内存常驻模式并配置开机自启动。

一次性开启和关闭

sudo nvidia-smi -pm 1 # 开启持久模式
sudo nvidia-smi -pm 0 # 关闭持久模式

注意:需要 root 权限。但是下次启动机器后,会默认关闭持久模式。

永久性开启

可通过设置开机启动文件的方式设置永久性开启持久模式,这样每次开机重启后,GPU驱动会一直处于开启模式。

编辑 /lib/systemd/system/nvidia-persistenced.service

sudo vim /lib/systemd/system/nvidia-persistenced.service

文件内容由两个版本,版本1: 

[Unit]
Description=NVIDIA Persistence Daemon
After=syslog.target[Service]
Type=forking
PIDFile=/var/run/nvidia-persistenced/nvidia-persistenced.pid
Restart=always
ExecStart=/usr/bin/nvidia-persistenced --verbose
ExecStopPost=/bin/rm -rf /var/run/nvidia-persistenced/*
TimeoutSec=300[Install]
WantedBy=multi-user.target

版本2:

[Unit]
Description=NVIDIA Persistence Daemon
Wants=syslog.target[Service]
Type=forking
ExecStart=/usr/bin/nvidia-persistenced --user nvidia-persistenced
ExecStopPost=/bin/rm -rf /var/run/nvidia-persistenced[Install]
WantedBy=multi-user.target

启动服务:

sudo systemctl enable nvidia-persistenced

 这样驱动的持久化模式就开启了。

参考链接:

https://docs.ksyun.com/documents/43249 

NVIDIA GPU 開啟持久化模式 | 不務正業工程師的家 

https://zhuanlan.zhihu.com/p/521581269 

GPU开启持久化模式 - yuhaohao - 博客园 

http://www.lryc.cn/news/512100.html

相关文章:

  • MS SQL Server 实战 排查多列之间的值是否重复
  • 【玩转MacBook】Git安装
  • 【优先算法】双指针 --(结合例题讲解解题思路)(C++)
  • 简述css中z-index的作用?如何用定位使用?
  • Redis——数据淘汰策略
  • 机器学习之KNN算法预测数据和数据可视化
  • 前端node.js
  • Excel基础知识
  • Spring Boot对访问密钥加密解密——RSA
  • Vue介绍
  • 表单元素(标签)有哪些?
  • 人工智能与云计算的结合:如何释放数据的无限潜力?
  • TCP Analysis Flags 之 TCP Out-Of-Order
  • 【MyBatis 核心工作机制】注解式开发与动态代理原理
  • 深度学习在图像识别中的最新进展与实践案例
  • vue3中如何自定义插件
  • 【机器学习】回归
  • Maven项目中不修改 pom.xml 状况下直接运行OpenRewrite的配方
  • 【翻译】Sora 系统卡-12月9日
  • 如何在 Spring Boot 微服务中设置和管理多个数据库
  • Ubuntu20.04安装Foxit Reader 福昕阅读器
  • 学习threejs,THREE.CircleGeometry 二维平面圆形几何体
  • Tonghttpserver6.0.1.3 使用整理(by lqw)
  • redis开发与运维-redis0401-补充-redis流水线与Jedis执行流水线
  • OPPO Java面试题及参考答案
  • Ubuntu 22.04 升级 24.04 问题记录
  • Java重要面试名词整理(五):Redis
  • 单元测试中创建多个线程测试 ThreadLocal
  • iDP3复现代码数据预处理全流程(二)——vis_dataset.py
  • 容器化部署服务全流程