当前位置: 首页 > news >正文

Ubuntu 22.04 安装Nvidia驱动加速deepseek

一键安装22.04 nvidia 驱动

  • nvidia 官网下载驱动
  • 我的环境是NVIDIA RTX A5000
  • nvidia 文档参考
  • 没有安装驱动之前确认自己的型号 lspci | grep -i vga (如数字2231) 参考
  • docker 支持nvidia ,注释了需要的取消注释即可 42行-92行
  • 一定要重启服务器哦,不然驱动不会生效的reboot
vim /nvidia_install.sh
#!/bin/bash
# -*- coding: utf-8 -*-
# Author: CIASM
# update 2025/02/27
# make.ha<<!
# check nvidia
lspci | grep -i vga
http://pci-ids.ucw.cz/mods/PC/10de/2204#add-apt-repository ppa:graphics-drivers/ppa
!echo "remove nvidia"
apt remove -y nvidia*echo "add nvidia repo"
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
tee /etc/apt/sources.list.d/nvidia-container-toolkit.listecho "check host nvidia"
ubuntu-drivers devicesecho "install nvidia"
apt-get update
apt install -y nvidia-driver-535echo "install docker NVIDIA GPU"
apt install -y nvidia-container-toolkitecho "install NVIDIA CUDA Toolkit"
apt install -y nvidia-cuda-toolkitecho "nvidia persist mode"
nvidia-smi -pm 1# docker 支持 nvidia 配置
<<!
echo "docker daemon.json"
rm -rf /etc/docker/daemon.json 
cat <<'EOF'>>/etc/docker/daemon.json
{"registry-mirrors": ["https://registry.hub.docker.com","https://ccr.ccs.tencentyun.com","https://dockerproxy.com","https://hub-mirror.c.163.com","https://docker.mirrors.sjtug.sjtu.edu.cn","https://docker.nju.edu.cn","https://registry-k8s-io.mirrors.sjtug.sjtu.edu.cn","https://docker.m.daocloud.io","https://docker.mirrors.ustc.edu.cn","https://mirror.iscas.ac.cn","https://s64h8lpn.mirror.aliyuncs.com","https://atomhub.openatom.cn","https://mirror.baidubce.com","https://docker.1panel.live","https://proxy.1panel.live","https://image.cloudlayer.icu","https://docker-0.unsee.tech","https://docker.tbedu.top","https://pull.loridocker.com","https://docker.melikeme.cn","https://docker.imgdb.de","https://docker.hlmirror.com","https://docker.kejilion.pro","https://hub.rat.dev","https://dockerpull.pw","https://hub.fast360.xyz","https://docker.xuanyuan.me","https://docker.1ms.run","https://xdark.top","https://func.ink","https://lispy.org"],"insecure-registries": ["192.168.11.40"],"runtimes": {"nvidia": {"args": [],"path": "nvidia-container-runtime"}}
}
EOFecho "restart docker"
systemctl restart dockerecho "test cuda docker"
docker run --rm --gpus all nvidia/cuda:12.2.0-base-ubuntu22.04 nvidia-smi
!

一键安装nvidia 驱动

  • 一定要重启服务器哦,不然驱动不会生效的reboot
bash /nvidia_install.sh

 查询安装完成的nvidia驱动情况

nvidia-smi

nvidia 持续模式

  • 持久模式(-pm)允许用户将 NVIDIA-SMI 设置持久化,即使在系统重启后也能生效。这意味着,您可以在会话期间配置设备,而无需每次重新启动系统时都手动重新应用设置。
  • 1:启用持久模式
  • 0:禁用持久模式
  • 立即生效
echo "nvidia persist mode"
nvidia-smi -pm 1

nvidia ECC 校验开启和关闭

  • ECC(错误纠正代码)是一种用于检测和纠正设备内存错误的技术。启用 ECC 可以提高系统稳定性,防止因内存错误而导致的数据损坏。
  • 1:启用 ECC
  • 0:禁用 ECC
  • reboot 系统生效
nvidia-smi -e 1

重置 ECC 错误计数(-p) 

  • -p 选项用于重置 ECC 错误计数器。如果 ECC 已启用,此计数器将跟踪检测到的内存错误数量。重置计数器可以帮助您监测和排除故障,并确保您收到设备错误的最新信息。
  • 0/VOLATILE,
  • 1/AGGREGATE
nvidia-smi -p 0

http://www.lryc.cn/news/543986.html

相关文章:

  • OkHttp、Retrofit、RxJava:一文讲清楚
  • 星环科技推出DeepSeek全场景解决方案:即开即用、企业级部署、端侧智能三位一体
  • Redis缓存一致性难题:如何让数据库和缓存不“打架”?
  • 动态部署Web应用程序与web.xml配置详解
  • 2025年软考报名费用是多少?全国费用汇总!
  • DeepSeek 15天指导手册——从入门到精通 PDF(附下载)
  • 【Javascript】js精度丢失
  • 让Word插上AI的翅膀:如何把DeepSeek装进Word
  • 秒杀系统的常用架构是什么?怎么设计?
  • 【文件基础操作】小笔记
  • RabbitMQ系列(七)基本概念之Channel
  • 本地搭建Koodo Reader书库结合内网穿透打造属于自己的移动图书馆
  • DeepSeek R1 训练策略4个阶段解析
  • 【博资考4】网安学院-硕转博考试内容
  • 30 分钟从零开始入门 CSS
  • C语言综合案例:学生成绩管理系统
  • 使用python做http代理请求
  • 数据库事务的基本要素(ACID)
  • DeepSeek R1满血+火山引擎详细教程
  • 大型语言模型技术对比:阿里Qwen qwq、DeepSeek R1、OpenAI o3与Grok 3
  • ArcGIS Pro可见性分析:精通地形视线与视域分析
  • 计算机工具基础(五)——Vim
  • Android应用app实现AI电话机器人接打电话
  • Mobaxterm服务器常用命令(持续更新)
  • Android14窗口管理自适应投屏分辨率
  • Shot Studio for macOS 发布 1.0.2
  • 《深度学习实战》第4集:Transformer 架构与自然语言处理(NLP)
  • Starrocks入门(二)
  • 银河麒麟高级服务器操作系统在线调整/pro/{PID}/limits文件中nofile的软限制和硬限制参数值操作方法
  • html css js网页制作成品——HTML+CSS甜品店网页设计(5页)附源码