当前位置: 首页 > news >正文

第三篇-Tesla P40+CentOS7+CUDA 11.7 部署实践

硬件环境

系统:CentOS-7
CPU: 14C28T
显卡:Tesla P40 24G

准备安装
驱动: 515
CUDA: 11.7
cuDNN: 8.9.2.26

安装依赖

yum clean all
yum update
yum install -y gcc gcc-c++ pciutils kernel-devel-$(uname -r) kernel-headers-$(uname -r)

查看GPU信息

lspci | grep -i nvidia

屏蔽 nouveau 显卡驱动

步骤一

查看是否安装了nouveau,有结果表示正在使用nouveau

lsmod | grep nouveau

步骤二

创建一个新的文件,在文件中加入下面两句代码

  vim /etc/modprobe.d/blacklist-nouveau.confblacklist nouveauoptions nouveau modeset=0

步骤三

  dracut --force

步骤四 重启,

  reboot

步骤五 验证是否禁用成功,没有结果表示禁用成功

  lsmod | grep nouveau  -----------------------------------

重建initramfs image

备份执行

  mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak dracut /opt/initramfs-$(uname -r).img $(uname -r)

修改运行级别为文本模式

    systemctl set-default multi-user.target

重启

    reboot

安装nvidia驱动

下载驱动

  https://www.nvidia.cn/Download/index.aspxOperating System:	Linux 64-bitCUDA Toolkit:	11.7我下载的是  NVIDIA-Linux-x86_64-515.105.01.run

运行

  ./NVIDIA-Linux-x86_64-515.105.01.run

重启之后出现选择界面,32 选择no

验证

  nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.65.01    Driver Version: 515.65.01    CUDA Version: 11.7     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla P40           Off  | 00000000:03:00.0 Off |                    0 |
| N/A   38C    P0    49W / 250W |      0MiB / 23040MiB |      1%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

安装cuda

下载文件

https://developer.nvidia.com/cuda-toolkit-archive
页面选择
Linux x86_64 CentOS 7 rulfile(local)

执行安装配置

  sh cuda_11.7.1_515.65.01_linux.run选accept

我只安装了 CUDA Toolkit 11.7 选择如下

│ - [ ] Driver │
│ [ ] 515.65.01 │
│ + [X] CUDA Toolkit 11.7 │
│ [ ] CUDA Demo Suite 11.7 │
│ [ ] CUDA Documentation 11.7 │
│ - [ ] Kernel Objects │
│ [ ] nvidia-fs │
│ Options

再选 install

配置环境变量

  vim /etc/profileexport PATH=/usr/local/cuda/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATHsource /etc/profile

验证

  nvcc -V 
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2022 NVIDIA Corporation
Built on Wed_Jun__8_16:49:14_PDT_2022
Cuda compilation tools, release 11.7, V11.7.99
Build cuda_11.7.r11.7/compiler.31442593_0

安装cuDNN

下载文件

  https://developer.nvidia.com/rdp/cudnn-downloadcudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xz

部署

  /opt/nvidia/cudnn/tar xvf cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xzcd cudnn-linux-x86_64-8.9.2.26_cuda11-archivecp include/cudnn.h /usr/local/cuda/includecp lib/libcudnn* /usr/local/cuda/lib64chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

部署完成

参考列表

Centos7安装NVIDIA GPU显卡驱动
https://blog.csdn.net/syl321314362/article/details/128751708

CentOS7 禁用nouveau及安装显卡驱动
https://blog.51cto.com/u_14825502/6101852

Centos升级OpenSSL版本
https://www.cnblogs.com/shiningrise/p/16840969.html

参考命令

centos07-关闭防火墙

  systemctl disable firewalld.servicesystemctl stop firewalld

其他参考

这个高版本安装失败

只能安装430.40对应cuda-11.4(好像),这个安装简单,但是cuda版本低

yum install nvidia-detect
检测显卡
$ nvidia-detect -v
根据检测的版本安装显卡驱动程序
$ yum install nvidia-x11-drv-430.40
版本号要一致重启,运行命令,查看状态
$ nvidia-smi

系列文章

第一篇-ChatGLM-webui-Windows安装部署-CPU版
第二篇-二手工作站配置
第三篇-Tesla P40+CentOS-7+CUDA 11.7 部署实践
第四篇-Miniconda3-CentOS7-安装
第五篇-ChatGLM2-6B模型下载
第六篇-ChatGLM2-6B-CentOS安装部署-GPU版

http://www.lryc.cn/news/103139.html

相关文章:

  • AC+FIT(瘦AP)配置浅谈
  • 【Python】PySpark 数据计算 ② ( RDD#flatMap 方法 | RDD#flatMap 语法 | 代码示例 )
  • 二叉树题目:左叶子之和
  • Spark SQL报错: Task failed while writing rows.
  • Linux系统下U盘打不开: No application is registered as handling this file
  • 07 定时器处理非活动连接(上)
  • python——案例四:判断字符串中的元素组成
  • 一起学算法(插入排序篇)
  • JVM基础篇-本地方法栈与堆
  • 防雷保护区如何划分,防雷分区概念LPZ介绍
  • 随手笔记——3D−3D:ICP求解
  • Python调用各大机器翻译API大全
  • 重生之我要学C++第六天
  • SpringBoot中ErrorPage(错误页面)的使用--【ErrorPage组件】
  • 【Android】APP网络优化学习笔记
  • 简单的知识图谱可视化+绘制nx.Graph()时报错TypeError: ‘_AxesStack‘ object is not callable
  • 【Matlab】基于粒子群优化算法优化BP神经网络的时间序列预测(Excel可直接替换数据)
  • 【机器学习】Cost Function for Logistic Regression
  • 【EI/SCOPUS会议征稿】2023年第四届新能源与电气科技国际学术研讨会 (ISNEET 2023)
  • 【计算机网络】10、ethtool
  • 什么是前端工程化?
  • 【深度学习】【三维重建】windows11环境配置tiny-cuda-nn详细教程
  • Matlab 一种自适应搜索半径的特征提取方法
  • 基于opencv的几种图像滤波
  • puppeteer代理的搭建和配置
  • 【简单认识MySQL的MHA高可用配置】
  • 【云原生】一文学会Docker存储所有特性
  • Android Ble蓝牙App(一)扫描
  • mac pd安装ubuntu并配置远程连接
  • 1.3 eureka+ribbon,完成服务注册与调用,负载均衡源码追踪