当前位置: 首页 > news >正文

如何将老板的游戏机接入阿里云自建K8S跑大模型(下)- 安装nvidia/gpu-operator支持GPU在容器中共享

文章目录

  • 安装nvidia/gpu-operator支持GPU在容器中共享

安装nvidia/gpu-operator支持GPU在容器中共享

安装 nvidia/gpu-operator遇到两个问题:

  1. 由于我们都懂的某个原因,导致某些镜像一直现在不成功。
    解决办法,准备一个🪜;
    或者,修改镜像地址,换成能访问的。
  2. 安装在宿主机上的 nvidia-container-toolkit配置给 containerd 使用; 我们的k8s使用的rke2;rke2 托管了containerd 的配置文件,直接修改重启后会被重置回去
    最后,我们采用 https://thenewstack.io/install-a-nvidia-gpu-operator-on-rke2-kubernetes-cluster/这篇文档中的步骤成功将 nvidia/gpu-operator 安装上了。

当时安装的详细步骤没有记录,重现起来太累了,也没有多少人阅读;说来算是虎头蛇尾,惭愧呀……
在这里插入图片描述

http://www.lryc.cn/news/350812.html

相关文章:

  • 代码随想录-Day16
  • 31.@Anonymous
  • oracle 表同一列只取最新一条数据写法
  • C语言游戏实战(12):植物大战僵尸(坤版)
  • 提权方式及原理汇总
  • 【leetcode----二叉树中的最大路径和】
  • Rust: 编译过程中链接器 `cc` 没有找到
  • 【vue-3】动态属性绑定v-bind
  • Rust:多线程环境下使用 Mutex<T> 还是 Arc<Mutex<T>> ?
  • 关于如何创建一个可配置的 SpringBoot Web 项目的全局异常处理
  • docker三种自定义网络(虚拟网络) overlay实现原理
  • C#上位机1ms级高精度定时任务
  • 盘点28个免费域名申请大全
  • 【vue】封装的天气展示卡片,在线获取天气信息
  • 【MySQL】库的操作和表的操作
  • 【学习笔记】后端(Ⅰ)—— NodeJS(Ⅱ)
  • VMware报平台不支持虚拟化Win10家庭版关闭Hyper-V及内核隔离
  • 简单介绍十款可以免费使用的API测试工具
  • 非授权人员进入报警系统
  • Mysql基础教程(03):AND
  • 为什么要使用 eval
  • BCD编码(8421)介绍
  • 前端javascript包管理,npm升级用pnpm
  • 数据库操作(函数)
  • [建堆堆排序的时间复杂度推导]向上建堆向下建堆堆排序的时间复杂度分析推导
  • 【C++初阶】--- C++入门(上)
  • 安装和使用图像处理软件GraphicsMagick @FreeBSD
  • 一款功能强大的安卓虚拟机应用——VMOS Pro使用分享
  • 【408真题】2009-12
  • vue3第三十三节(TS 之 computed watch)