当前位置: 首页 > news >正文

【Docker基础】Docker镜像管理:docker pull详解

目录

1 Docker镜像基础概念

1.1 什么是Docker镜像?

1.2 镜像与容器的关系

1.3 镜像仓库(Registry)

2 docker pull命令详解

2.1 基本语法

2.2 参数解释

2.3 拉取镜像的基本流程

2.4 镜像分层结构解析

3 docker pull实战指南

3.1 基本使用示例

3.2 指定镜像标签

3.3 使用镜像摘要(DIGEST)

3.4 拉取多平台镜像

3.5 批量拉取所有标签

4 镜像拉取优化技巧

4.1 使用国内镜像加速器

4.2 只下载镜像不拉取

4.3 清理未使用的镜像

4.4 查看镜像下载进度

5 常见问题与解决方案

5.1 拉取镜像速度慢

5.2 拉取镜像时报错"manifest unknown"

5.3 拉取镜像时报错"no space left on device"

5.4 如何验证下载的镜像完整性

6 深入理解镜像拉取机制

6.1 镜像拉取的底层实现

6.2 镜像拉取的并发下载

6.3 镜像拉取的重试机制

7 总结


1 Docker镜像基础概念

1.1 什么是Docker镜像?

Docker镜像是一个 轻量级、独立、可执行的软件包,它包含了运行某个软件所需的一切:代码、运行时环境、系统工具、系统库和设置。镜像采用分层存储结构,每一层都可以被复用,这使得镜像非常高效且占用空间小。

1.2 镜像与容器的关系

镜像和容器是Docker中最核心的两个概念,它们的关系可以类比为:
  • 镜像:相当于面向对象编程中的"类"(Class)
  • 容器:相当于"实例"(Instance)
当镜像被运行时,它就变成了一个容器,你可以从一个镜像创建多个容器,就像可以从一个类创建多个对象实例一样

1.3 镜像仓库(Registry)

  • Docker镜像存储在镜像仓库中,主要有两种类型:公共仓库与私有仓库
  • 镜像仓库允许用户存储、分享和分发Docker镜像,docker pull就是从这些仓库中拉取镜像到本地的主要命令

2 docker pull命令详解

docker pull是Docker中最基础也是最重要的命令之一,它用于从镜像仓库中拉取或下载镜像到本地。

2.1 基本语法

docker pull [OPTIONS] NAME[:TAG|@DIGEST]

2.2 参数解释

参数

说明

NAME

镜像名称,格式通常为[仓库URL/]用户名/镜像名

TAG

镜像标签,默认为latest

DIGEST

镜像的内容哈希值,用于精确指定某个镜像版本

--all-tags, -a

下载仓库中所有标记的镜像

--disable-content-trust

跳过镜像验证(默认为true)

--platform

指定平台,如linux/amd64, linux/arm64等

--quiet, -q

安静模式,只显示镜像ID

2.3 拉取镜像的基本流程

  • docker pull命令执行时的内部流程:
  • 用户通过Docker客户端发出docker pull命令
  • Docker客户端将请求发送给Docker守护进程
  • 守护进程联系镜像仓库,首先获取镜像的manifest文件
  • 根据manifest中的信息,逐个下载镜像的各个层(layer)
  • 下载完成后,在本地组装这些层,形成完整的镜像
  • 将结果返回给客户端,最终显示给用户

2.4 镜像分层结构解析

Docker镜像采用分层存储结构,每一层都是只读的,当拉取镜像时,实际上是在下载多个层。这种设计带来了几个优势:
  • 存储效率:不同镜像可以共享相同的层
  • 传输效率:如果本地已有某些层,只需下载缺失的层
  • 构建速度:构建镜像时,未更改的层可以被缓存和复用

3 docker pull实战指南

3.1 基本使用示例

  • 从Docker Hub拉取官方镜像
docker pull ubuntu:20.04
  • 从Docker Hub拉取用户镜像
docker pull username/repository:tag
  • 从私有仓库拉取镜像
docker pull myregistry.example.com:5000/ubuntu:20.04

3.2 指定镜像标签

  • 镜像标签(TAG)用于标识同一镜像的不同版本,如果不指定标签,默认使用latest
# 拉取最新的nginx镜像
docker pull nginx# 拉取特定版本的nginx
docker pull nginx:1.21.6# 拉取alpine精简版的nginx
docker pull nginx:1.21.6-alpine

3.3 使用镜像摘要(DIGEST)

  • 标签可能会被更新指向不同的镜像,而摘要(DIGEST)是镜像内容的唯一标识符,可以确保每次拉取的都是完全相同的镜像
# 先获取镜像的摘要信息
docker pull nginx:1.21.6
docker images --digests | grep nginx# 使用摘要拉取镜像
docker pull nginx@sha256:644a70516a26004c97d0d85c7fe1d0c3a67ea8ab7ddf4aff193d9f301670cf36

3.4 拉取多平台镜像

  • Docker支持多平台镜像,可以使用--platform参数指定目标平台:
docker pull --platform linux/arm64 ubuntu:20.04

3.5 批量拉取所有标签

docker pull --all-tags ubuntu 
# 注意:这会下载该仓库中的所有镜像,可能会消耗大量带宽和存储空间

4 镜像拉取优化技巧

4.1 使用国内镜像加速器

在国内直接拉取Docker Hub的镜像可能会很慢,可以配置国内镜像加速器:
  • 编辑或创建/etc/docker/daemon.json
  • 添加以下内容:
{"registry-mirrors": ["https://registry.docker-cn.com","https://hub-mirror.c.163.com","https://mirror.baidubce.com"]
}
  • 重启Docker服务:
systemctl daemon-reload 
systemctl restart docker

4.2 只下载镜像不拉取

  • 如果只想查看镜像信息而不实际下载,可以使用:
docker manifest inspect ubuntu:20.04

4.3 清理未使用的镜像

  • 定期清理未使用的镜像可以节省磁盘空间:
docker image prune

4.4 查看镜像下载进度

  • 默认情况下,docker pull会显示详细的下载进度。如果需要更简洁的输出,可以使用-q参数:
docker pull -q ubuntu:20.04

5 常见问题与解决方案

5.1 拉取镜像速度慢

可能原因
  • 网络连接问题
  • 镜像服务器在国外
  • 本地DNS解析问题
解决方案
  • 使用国内镜像加速器
  • 检查网络连接
  • 更换DNS服务器,如使用8.8.8.8或114.114.114.114

5.2 拉取镜像时报错"manifest unknown"

可能原因
  • 镜像名称拼写错误
  • 指定的标签不存在
  • 私有镜像需要登录
解决方案
  • 检查镜像名称和标签是否正确
  • 访问镜像仓库网站确认可用标签
  • 对于私有镜像,先执行docker login

5.3 拉取镜像时报错"no space left on device"

可能原因
  • Docker存储空间不足
  • 系统磁盘空间不足
解决方案
  • 清理未使用的镜像和容器
  • 调整Docker存储驱动配置
  • 增加系统磁盘空间

5.4 如何验证下载的镜像完整性

  • Docker默认会验证镜像的完整性。你也可以手动验证:
docker trust inspect --pretty ubuntu:20.04

6 深入理解镜像拉取机制

6.1 镜像拉取的底层实现

当执行docker pull时,Docker实际上执行了以下操作:
  • 解析镜像名称:确定要使用的registry、repository和tag
  • 获取认证令牌:如果需要认证,从认证服务器获取令牌
  • 下载manifest:获取镜像的配置和层信息
  • 下载各层数据:并行下载各个层(layer)
  • 验证层数据:检查每个层的校验和
  • 组装镜像:将所有层组合成完整的镜像

6.2 镜像拉取的并发下载

  • Docker会并行下载镜像的各个层以提高下载速度,可以通过以下方式优化:
# 查看当前下载并发数
docker info | grep -i concurrent# 通过修改daemon.json调整并发下载数
{"max-concurrent-downloads": 3
}

6.3 镜像拉取的重试机制

  • Docker内置了下载失败的重试机制,默认情况下会尝试5次,可以通过以下配置调整:
{"max-download-attempts": 10
}

7 总结

docker pull是Docker中最基础也是最重要的命令之一,理解其工作原理和最佳实践对于高效使用Docker至关重要。了解它能够更加高效、安全地管理Docker镜像,为容器化应用打下坚实的基础。
http://www.lryc.cn/news/573196.html

相关文章:

  • Cursor汉化
  • Tesla T4 安装 Audio2face
  • 大模型在急性弥漫性腹膜炎预测及治疗方案制定中的应用研究
  • 一站式了解责任链模式
  • Taro 跨端应用性能优化全攻略:从原理到实践
  • 抖音的视频怎么下载下来——下载狗解析工具
  • 【StarRocks系列】StarRocks vs Mysql
  • 【StarRocks系列】join查询优化
  • 【软考高级系统架构论文】论软件设计方法及其应用
  • 【软考高级系统架构论文】论NoSQL数据库技术及其应用
  • springboot通过独立事务管理器实现资源隔离与精准控制​
  • 基于Python、tkinter、sqlite3 和matplotlib的校园书店管理系统
  • AI大模型学习之基础数学:微积分在AI大模型中的核心-梯度与优化(梯度下降)详解
  • ZooKeeper 3.9.2 集群安装指南
  • 【LeetCode#第228题】汇总区间(简单题)
  • ad24智能pdf输出的装配图没有四个边角那里的圆孔
  • 1、自然语言处理任务全流程
  • `customRef` 在实战中的使用:防抖、计算属性缓存和异步数据获取
  • Duende Identity Server学习之一:认证服务器及一个Oidc/OAuth认证、用于Machine 2 Machine的客户端
  • 【C/C++】Gtest + GMock 简单使用示例
  • Android Studio 打 APK 包报错 Invalid keystore format 的解决方法
  • python web开发-Flask数据库集成
  • Solidity内部合约创建全解析:解锁Web3开发新姿势
  • 分布式锁 不同的拒绝策略 应用场景 业务上的思考
  • Docker简单介绍与使用以及下载对应镜像(项目前置)
  • AWS RDS/Aurora 开启 Database Insights 高级模式全攻略
  • C++11 std::thread 多线程编程详解
  • Python从入门到实战学习笔记(二)
  • 如何用 eBPF 实现 Kubernetes 网络可观测性?实战指南
  • PowerBI HtmlContent生成表格