当前位置: 首页 > news >正文

Docker底层实现

Docker采用c/s架构,Docker守护进程( Daemon )作为服务端,接受来自客户端(命令行)的请求,并处理这些请求(创建、运行、分发容器) 。客户端和服务端既可以运行在一个机器上, 也可通过 socket 或者RESTful API来进行通信。

命名空间

命名空间保证了容器之间彼此互不影响,通过不同资源的命名空间实现了资源的隔离。

  • pid命名空间:pid隔离,所有容器中的进程的父进程为Docker进程,不同容器中进程具有不同的命名空间。
  • net命名空间:网络隔离,每个 net 命名空间有独立的网络设备、IP 地址、路由表、/proc/net目录等。
  • ipc命名空间:进程间交互方法(interprocess communication - IPC),包括信号量、消息队列和共享内存等的隔离,容器的进程间交互实际上还是host上具有相同pid命名空间中的进程间交互,因此需要在 IPC 资源申请时加入命名空间信息,每个 IPC 资源有一个唯一的32位id。
  • mnt命名空间:类似chroot,每个命名空间中的进程所看到的文件目录就被隔离开了。
  • UTS("UNIX Time-sharing System") 命名空间允许每个容器拥有独立的 hostname 和 domainname,使其在网络上可以被视作一个独立的节点而非主机上的一个进程。
  • user命名空间:每个容器可以有不同的用户和组 id, 也就是说可以在容器内用容器内部的用户执行程序而非主机上的用户。

控制组(cgroups)

控制组(cgroups)是 Linux 内核的一个特性,主要用来对共享资源进行隔离、限制、审计等。只有能控制分配到容器的资源,才能避免当多个容器同时运行时的对系统资源的竞争。控制组可以提供对容器的内存、CPU、磁盘IO等资源的限制和审计管理。

联合文件系统(UnionFS)

联合文件系统(UnionFS)是一种分层、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a  single virtual filesystem)。联合文件系统是 Docker 镜像的基础。镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。

Docker网络

Docker 的网络实现其实就是利用了 Linux 上的网络命名空间和虚拟网络设备。Docker 中的网络接口默认都是虚拟的接口。虚拟接口的优势之一是转发效率较高。Linux 通过在内核中进行数据复制来实现虚拟接口之间的数据转发,发送接口的发送缓存中的数据包被直接复制到接收接口的接收缓存中。对于本地系统和容器内系统看来就像是一个正常的以太网卡,只是它不需要真正同外部网络设备通信,速度要快很多。

Docker 创建一个容器的时候,会执行如下操作:

  • 创建一对虚拟接口,分别放到本地主机和新容器中;
  • 本地主机一端桥接到默认的 docker0 或指定网桥上,并具有一个唯一的名字,如veth65f9;
  • 容器一端放到新容器中,并修改名字作为 eth0,这个接口只在容器的命名空间可见;
  • 从网桥可用地址段中获取一个空闲地址分配给容器的 eth0,并配置默认路由到桥接网卡veth65f9。

在 docker run 的时候通过 --net 参数来指定容器的网络配置,有4个可选值:

  • --net=bridge 这个是默认值, 连接到默认的网桥。
  • --net=host 告诉 Docker 不要将容器网络放到隔离的命名空间中,即不要容器化容器内的网络。此时容器使用本地主机的网络,它拥有完全的本地主机接口访问权限。容器进程可以跟主机其它 root 进程一样可以打开低范围的端口,可以访问本地网络服务比如 Dbus,还可以让容器做一些影响整个主机系统的事情,比如重启主机。因此使用这个选项的时候要非常小心。 如果进一步的使用 --privileged=true ,容器会被允许直接配置主机的网络堆栈。
  • --net=container:NAME_or_ID 让 Docker 将新建容器的进程放到一个已存在容器的网络栈中,新容器进程有自己的文件系统、进程列表和资源限制,但会和已存在的容器共享IP地址和端口等网络资源,两者进程可以直接通过 lo 环回接口通信。
  • --net=none 让 Docker 将新容器放到隔离的网络栈中,但是不进行网络配置。之后,用户可以自己进行配置。

模拟网络配置流程

首先,启动一个/bin/bash容器, 指定--net=none参数。

$ docker run -i -t --rm --net=none base /bin/bash
root@63f36fc01b5f:/#

在本地主机查找容器的进程 id, 并为它创建网络命名空间。

$ docker inspect -f '{{.State.Pid}}' 63f36fc01b5f
2778$ pid=2778
$ sudo mkdir -p /var/run/netns
$ sudo ln -s /proc/$pid/ns/net /var/run/netns/$pid

检查桥接网卡的 IP 和子网掩码信息。

$ ip addr show docker0
21: docker0: ...
inet 172.17.42.1/16 scope global docker0
...

创建一对“veth pair”接口 A 和 B,绑定 A 到网桥 docker0 ,并启用它。

$ sudo ip link add A type veth peer name B
$ sudo brctl addif docker0 A
$ sudo ip link set A up

将B放到容器的网络命名空间, 命名为 eth0, 启动它并配置一个可用 IP( 桥接网段)和默认网关。

$ sudo ip link set B netns $pid
$ sudo ip netns exec $pid ip link set dev B name eth0
$ sudo ip netns exec $pid ip link set eth0 up
$ sudo ip netns exec $pid ip addr add 172.17.42.99/16 dev eth0
$ sudo ip netns exec $pid ip route add default via 172.17.42.1

http://www.lryc.cn/news/160238.html

相关文章:

  • PY32F003F18之RS485通讯
  • 概率论与数理统计学习笔记(7)——全概率公式与贝叶斯公式
  • 深入了解 Axios 的 put 请求:使用技巧与最佳实践
  • 浅谈Http协议、TCP协议(转载)
  • flatten-maven-plugin使用
  • Vue3中快速简单使用CKEditor 5富文本编辑器
  • qt简易网络聊天室 数据库的练习
  • Navicat连接mysql8.0:提示无法加载身份验证插件“caching_sha2_password”
  • 手写签名到背景上合为1张图
  • 华为认证系统学习大纲及课程
  • 某米ax3000路由器组网解析
  • 【leetcode 力扣刷题】数学题之除法:哈希表解决商的循环节➕快速乘求解商
  • Union类型和集合的union()方法-set.union()
  • 简明SQL别名指南:掌握AS实现列名更名
  • 基于量子密钥分发和区块链技术的新一代加密通信系统
  • 网络安全-子域名收集
  • go-zero jwt 鉴权快速实战
  • 9.8day58 单调栈
  • 快速完成工信部APP备案流程_以阿里云APP备案为例
  • uniapp中UView中 u-form表单在v-for循环下如何进行表单校验
  • 工作新时代,腾讯轻联塑造高效办公未来
  • JavaScript实现广告倒计时和跳过广告
  • 蚂蚁发布金融大模型:两大应用产品支小宝2.0、支小助将在完成备案后
  • Jenkins 持续集成:Linux 系统 两台机器互相免密登录
  • Golang-GJSON 快速而简单的方法来从 json 文档获取值
  • echarts根据x轴数据长度判断是否倾斜展示/柱状图上方显示数字
  • Eviews用向量自回归模型VAR实证分析公路交通通车里程与经济发展GDP协整关系时间序列数据和脉冲响应可视化...
  • 群晖NAS:通过Docker 部署宝塔面板【注册表:cyberbolt/baota】
  • pdfjs在线预览组件的使用
  • python线程、协程