当前位置: 首页 > news >正文

【教程】创建NVIDIA Docker共享使用主机的GPU

转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn]

如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~

这套是我跑完整理的。直接上干货,复制粘贴即可!

# 先安装toolkit
sudo apt-get update
sudo apt-get install -y ca-certificates curl gnupg lsb-releasesudo mkdir -p /etc/apt/keyrings
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpgecho "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/nullsudo apt-get update
sudo apt-get install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
docker --versiondistribution=$(. /etc/os-release; echo $ID$VERSION_ID) && \
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg && \
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
sed 's#deb #deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] #' | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.listsudo apt-get update
sudo apt-get install -y nvidia-container-toolkitsudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<EOF
{ "registry-mirrors": ["https://docker.unsee.tech"] }
EOF
sudo systemctl daemon-reload
sudo systemctl restart dockersudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker# 然后启动容器。(这个地方记得先删除#注释内容)
docker run -itd \--gpus all  \  										# 挂载所有GPU--shm-size=128g \									# 设置共享内存大小# -v /dev/shm:/dev/shm \ 				        	# 共享宿主机的共享内存# --network host \       				        	# 分布式系统中推荐打开--name cu12_sxf \									# 容器命名-v /mnt/disk/:/mnt/disk/ \  	# 挂载目录-v /home/user/Desktop:/Desktop \  	# 挂载目录nvidia/cuda:12.1.0-base-ubuntu20.04

进入创建的容器:

docker exec -it cu12_sxf /bin/bash

保存容器为新镜像:

# container_id是"docker ps -a"显示的id
docker commit <container_id> cu12_sxf:latest

使用新镜像创建容器:

docker run -itd \--gpus all  \  								# 挂载所有GPU--shm-size=128g \							# 设置共享内存大小# -v /dev/shm:/dev/shm \ 					# 共享宿主机的共享内存# --network host \       					# 分布式系统中推荐打开--name cu12_sxf \							# 容器命名-v /mnt/disk:/mnt/disk\  	                # 挂载目录-v /home/user/Desktop:/Desktop \  	        # 挂载目录cu12_sxf:latest

保存镜像到文件:

# cu12_sxf"docker images"显示的名称
docker save -o cu12_sxf.tar cu12_sxf:latest

从文件加载镜像:

docker load -i cu12_sxf.tar

为容器中的用户设置密码:

# 进入容器后设置密码:
passwd

最终在容器内查询GPU信息效果:


打标签:

docker tag cu12_sxf:latest <服务器IP>:5000/cu12_sxf:latest

推送镜像到私有仓库:

docker push <服务器IP>:5000/<image_name>:<tag>

从私有仓库拉取镜像:

docker pull <服务器IP>:5000/<image_name>:<tag>

http://www.lryc.cn/news/498867.html

相关文章:

  • CEEMDAN-CPO-VMD二次分解(CEEMDAN+冠豪猪优化算法CPO优化VMD)
  • 图论理论基础和存储方式的实现
  • 【实分析】【二】2.2 (c)自然数的序
  • STM32串口接收与发送(关于为什么接收不需要中断而发生需要以及HAL_UART_Transmit和HAL_UART_Transmit_IT的区别)
  • k8s 之storageclass使用nfs动态申请PV
  • vue移动端实现下载(截图)功能
  • 【Golang】Golang基础语法之面向对象:结构体和方法
  • 【西门子PLC.博途】——在S71200里写时间设置和读取功能块
  • 位运算(一)位运算简单总结
  • 工厂方法模式的理解和实践
  • C# 设计模式--观察者模式 (Observer Pattern)
  • 【开发语言】层次状态机(HSM)介绍
  • 03-13、SpringCloud Alibaba第十三章,升级篇,服务降级、熔断和限流Sentinel
  • 【k8s 深入学习之 event 聚合】event count累记聚合(采用 Patch),Message 聚合形成聚合 event(采用Create)
  • leetcode104.二叉树的最大深度
  • 蓝桥杯2117砍竹子(简单易懂 包看包会版)
  • LCD与lvgl
  • SpringBoot 赋能:精铸超稳会员制医疗预约系统,夯实就医数据根基
  • android studio 读写文件操作(应用场景二)
  • 小尺寸低功耗蓝牙模块在光伏清扫机器人上的应用
  • 防火墙有什么作用
  • MongoDB-BSON 协议与类型
  • 学习threejs,使用VideoTexture实现视频Video更新纹理
  • 怎么获取键值对的键的数值?
  • 数据结构排序算法详解
  • 在Linux设置postgresql开机自启动,创建一个文件 postgresql-15.service
  • 【kafka】消息队列的认识,Kafka与RabbitMQ的简单对比
  • ProjectSend 身份认证绕过漏洞复现(CVE-2024-11680)
  • Android笔记(三十四):onCreate执行Handler.post在onResume后才能执行?
  • 关闭模组的IP过滤功能