当前位置: 首页 > news >正文

第三篇-Tesla P40+CentOS-7+CUDA 11.7 部署实践

第一篇-ChatGLM-webui-Windows安装部署-CPU版
第二篇-二手工作站配置
第三篇-Tesla P40+CentOS-7+CUDA 11.7 部署实践

硬件环境

系统:CentOS-7
CPU: 14C28T
显卡:Tesla P40 24G

准备安装
驱动: 515
CUDA: 11.7
cuDNN: 8.9.2.26

安装依赖

yum clean all
yum update
yum install -y gcc gcc-c++ pciutils kernel-devel-$(uname -r) kernel-headers-$(uname -r)

查看GPU信息

lspci | grep -i nvidia

屏蔽 nouveau 显卡驱动

步骤一

查看是否安装了nouveau,有结果表示正在使用nouveau

lsmod | grep nouveau

步骤二

创建一个新的文件,在文件中加入下面两句代码

  vim /etc/modprobe.d/blacklist-nouveau.confblacklist nouveauoptions nouveau modeset=0

步骤三

  dracut --force

步骤四 重启,

  reboot

步骤五 验证是否禁用成功,没有结果表示禁用成功

  lsmod | grep nouveau  -----------------------------------

重建initramfs image

备份执行

  mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak dracut /opt/initramfs-$(uname -r).img $(uname -r)

修改运行级别为文本模式

    systemctl set-default multi-user.target

重启

    reboot

安装nvidia驱动

下载驱动

  https://www.nvidia.cn/Download/index.aspxOperating System:	Linux 64-bitCUDA Toolkit:	11.7我下载的是  NVIDIA-Linux-x86_64-515.105.01.run

运行

  ./NVIDIA-Linux-x86_64-515.105.01.run

重启之后出现选择界面,32 选择no

验证

  nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.65.01    Driver Version: 515.65.01    CUDA Version: 11.7     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla P40           Off  | 00000000:03:00.0 Off |                    0 |
| N/A   38C    P0    49W / 250W |      0MiB / 23040MiB |      1%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

安装cuda

下载文件

https://developer.nvidia.com/cuda-toolkit-archive
页面选择
Linux x86_64 CentOS 7 rulfile(local)

执行安装配置

  sh cuda_11.7.1_515.65.01_linux.run选accept

我只安装了 CUDA Toolkit 11.7 选择如下

│ - [ ] Driver │
│ [ ] 515.65.01 │
│ + [X] CUDA Toolkit 11.7 │
│ [ ] CUDA Demo Suite 11.7 │
│ [ ] CUDA Documentation 11.7 │
│ - [ ] Kernel Objects │
│ [ ] nvidia-fs │
│ Options

再选 install

配置环境变量

  vim /etc/profileexport PATH=/usr/local/cuda/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATHsource /etc/profile

验证

  nvcc -V 
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Wed_Jun__8_16:49:14_PDT_2022
Cuda compilation tools, release 11.7, V11.7.99
Build cuda_11.7.r11.7/compiler.31442593_0

安装cuDNN

下载文件

  https://developer.nvidia.com/rdp/cudnn-downloadcudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xz

部署

  /opt/nvidia/cudnn/tar xvf cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xzcd cudnn-linux-x86_64-8.9.2.26_cuda11-archivecp include/cudnn.h /usr/local/cuda/includecp lib/libcudnn* /usr/local/cuda/lib64chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

部署完成

参考列表

Centos7安装NVIDIA GPU显卡驱动
https://blog.csdn.net/syl321314362/article/details/128751708

CentOS7 禁用nouveau及安装显卡驱动
https://blog.51cto.com/u_14825502/6101852

Centos升级OpenSSL版本
https://www.cnblogs.com/shiningrise/p/16840969.html

参考命令

centos07-关闭防火墙

  systemctl disable firewalld.servicesystemctl stop firewalld

其他参考

这个高版本安装失败

只能安装430.40对应cuda-11.4(好像),这个安装简单,但是cuda版本低

yum install nvidia-detect
检测显卡
$ nvidia-detect -v
根据检测的版本安装显卡驱动程序
$ yum install nvidia-x11-drv-430.40
版本号要一致重启,运行命令,查看状态
$ nvidia-smi
http://www.lryc.cn/news/97787.html

相关文章:

  • Unity游戏源码分享-ARPG游戏Darklight.rar
  • 类型转换运算符
  • Kafka 入门到起飞系列 - 消费者组管理、位移管理
  • SpringBoot——数据层三组件之间的关系
  • LeetCode647.Palindromic-Substrings<回文子串>
  • React的hooks---useContext
  • 【Terraform学习】TerraformCloud入门介绍(快速入门)
  • linux实现运行java分包部署
  • 数据安全之全景图系列——数据分类分级落地实践
  • C++实现MySQL数据库连接池
  • day4 驱动开发 c语言学习
  • history命令:显示命令执行时间
  • Django接口返回JSON格式数据报文
  • OBS 迁移--华为云
  • 【Docker consul的容器服务更新与发现】
  • MFC第二十天 数值型关联变量 和单选按钮与复选框的开发应用
  • 服务器 Docker Alist挂载到本地磁盘(Mac版)夸克网盘
  • EMP-SSL: TOWARDS SELF-SUPERVISED LEARNING IN ONETRAINING EPOCH
  • 注解和反射01--什么是注解
  • 虚拟机 RHEL8 安装 MySQL 8.0.34
  • kafka 总结宝典
  • 跨平台力量:探索C++Qt框架的未来前景
  • 基于长短期神经网络LSTM的位移监测,基于长短期神经网络的位移预测,LSTM的详细原理
  • ChatGPT漫谈(二)
  • 【LangChain】检索器之MultiQueryRetriever
  • 教师ChatGPT的23种用法
  • 【libevent】http客户端1:转存http下载的数据
  • Pytorch学习笔记 | 数据类型 | mnist数据集
  • Linux虚拟机(lvm)报Unmount and run xfs_repair
  • 【ESP32】Espressif-IDE及ESP-IDF安装