当前位置: 首页 > news >正文

腾讯云国际代充-GPU服务器安装驱动教程NVIDIA Tesla

腾讯云国际站GPU 云服务器是基于 GPU 的快速、稳定、弹性的计算服务,主要应用于深度学习训练/推理、图形图像处理以及科学计算等场景。 GPU 云服务器提供和标准腾讯云国际 CVM 云服务器一致的方便快捷的管理方式。
GPU 云服务器通过其强大的快速处理海量数据的计算性能,有效解放用户的计算压力,提升业务处理效率与竞争力。腾讯云国际站提供全面广泛的服务内容。无-需-绑-定PayPal,代-充-值腾讯云国际站、阿里云国际站、AWS亚马逊云、GCP谷歌云,官方授权经销商!靠谱!T-G 飞机 @unirech_dingding下面主要以以 CentOS 操作系统为例,介绍腾讯云国际GPU云服务器如何安装 Tesla Driver。

操作场景
腾讯云国际站GPU 云服务器正常工作需提前安装正确的基础设施软件,对 NVIDIA 系列 GPU 而言,有以下两个层次的软件包需要安装:

  • 驱动 GPU 工作的硬件驱动程序。
  • 上层应用程序所需要的库。

操作步骤
Linux 驱动安装
Linux 驱动安装采用 Shell 脚本安装方式,适用于任何 Linux 发行版,包括 CentOS,Ubuntu 等。

NVIDIA Telsa GPU 的 Linux 驱动在安装过程中需要编译 kernel module,系统需提前安装 gcc 和编译 Linux Kernel Module 所依赖的包,例如 kernel-devel-$(uname -r) 等。

1.执行以下命令,检查当前系统中是否已安装 dkms。

rpm -qa | grep -i dkms

返回结果如下图,则表示已安装 dkms。
腾讯云国际代充

如未安装 dkms,则执行以下命令进行安装。

sudo yum install -y dkms

2.登录 NVIDIA 驱动下载 或访问 http://www.nvidia.com/Download/Find.aspx

3.选择操作系统和安装包,并单击【SEARCH】搜寻驱动,选择要下载的驱动版本。本文以 V100 为例,如下图所示:

注意: 操作系统(Operating System)选择 Linux 64-bit 即表示下载 shell
安装文件。如果选择具体的发行版,则下载的文件是对应的包安装文件。

腾讯云国际站代充

4.选择特定的版本进入下载页面,单击【DOWNLOAD】。如下图所示:
腾讯云代充

5.如有填写个人信息的页面可选择直接跳过,当出现以下页面时,右键单击【AGREE&DOWNLOAD】并选择菜单中的【复制链接地址】。如下图所示:
腾讯云代充

6.参考 使用标准方式登录 Linux 实例(推荐),登录 GPU 实例。您也可以根据实际操作习惯,选择其他不同的登录方式:

  • 使用远程登录软件登录 Linux 实例
  • 使用 SSH 登录 Linux 实例

7.使用 wget 命令, 粘贴 步骤5 中已获取的链接地址,下载安装包。如下图所示:
腾讯云代充
或者您可在本地系统下载 NVIDIA 安装包,再上传到 GPU 实例的服务器。
8.执行以下命令,对安装包添加执行权限。 例如,对文件名为 NVIDIA-Linux-x86_64-418.126.02.run 添加执行权限。

chmod +x NVIDIA-Linux-x86_64-418.126.02.run

9.依次执行以下命令,检查当前系统中是否已安装 gcc 和 kernel-devel 包。

rpm -qa | grep kernel-devel
rpm -qa | grep gcc

返回结果如下,则表示已安装 gcc 和 kernel-devel。

腾讯云代充国际
如未安装,则请执行以下命令进行安装。

sudo yum install -y gcc kernel-devel

注意: 如升级了 kernel 版本,则需要将 kernel-devel 升级至与 kernel 相同的版本。

10.执行以下命令,运行驱动安装程序,并按提示进行后续操作。

sudo sh NVIDIA-Linux-x86_64-418.126.02.run

11.安装完成后,执行以下命令进行验证。

nvidia-smi

如返回信息类似下图中的 GPU 信息,则说明驱动安装成功。
腾讯云GPU云服务器

Windows 驱动安装

  1. 参考 使用 RDP 文件登录 Windows 实例(推荐),登录 GPU 实例。

  2. 访问 NVIDIA 驱动下载 官网。

  3. 选择操作系统和安装包,并选择对应驱动程序。本文以 V100 为例,如下图所示:
    GPU云服务器

  4. 打开下载驱动程序所在的文件夹,双击安装文件开始安装,按照界面上的提示安装驱动程序并根据需要重启实例。
    安装完成后,如需验证 GPU 是否正常工作,请查看设备管理器。

安装失败原因
Linux 系统驱动安装失败表现为 nvidia-smi 无法工作,通常原因如下:

  1. 系统缺乏编译 kernel module 所需要的包,如 gcc,kernel-devel-xxx 等,导致无法编译,最终安装失败。
  2. 系统里面存在多个版本的 kernel,由于 DKMS 的不正确配置,导致驱动编译为非当前版本 kernel 的 kernelmodule,导致 kernel module 安装失败。
  3. 安装驱动后,升级了 kernel 版本导致原来的安装失效。
http://www.lryc.cn/news/152411.html

相关文章:

  • 【python爬虫】9.带着小饼干登录(cookies)
  • 原神剑冢三层封印怎么解开 原神剑冢三层封印在哪里打
  • Papers with Semi-supervised Learning for Medical Image Segmentation(SSL4MIS)
  • c#继承(new base)的使用
  • 【办公自动化】使用Python批量处理Excel文件并转为csv文件
  • 手机怎么剪视频?分享一些剪辑工具和注意事项
  • 面试题汇总
  • LLVM系列:1.设计思想和LLVM IR简介
  • mysql中间件Atlas
  • ChatGPT 实现动态地图可视化展示
  • Vue.js安装步骤和注意事项
  • IDEA中Run/Debug Configurations添加VM options和Program arguments
  • 信息技术03--初/高中--简答题(73道知识简答)
  • Matlab之统计一维数组直方图 bin 计数函数histcounts
  • TDengine函数大全-时间和日期函数
  • 算法笔记——路径问题
  • Arcface部署应用实战
  • MySQL InnoDB 是怎么使用 B+ 树存数据的?
  • 手撕红黑树
  • 举例说明自然语言处理(NLP)技术
  • 淘宝详情API接口在各种应用中的作用性
  • java用正则方法验证文件名是否合法
  • 【learnopengl】Assimp构建与编译
  • 小兔鲜商02
  • 一键替换工程文件和场景中的UI对象字体
  • 微信小程序编辑器代码格式缩进设置
  • Android Aidl跨进程通讯(二)--异常捕获处理
  • Android中OkHttp源码阅读二(责任链模式)
  • 2023年03月 C/C++(六级)真题解析#中国电子学会#全国青少年软件编程等级考试
  • 顺序表链表OJ题(1)——【LeetCode】