当前位置: 首页 > news >正文

什么是零拷贝以及其应用场景是什么?

写在前面

本文看下什么是零拷贝,以及其具体的应用场景有哪些。

1:什么是零拷贝

想要解释清楚什么是零拷贝,需要先来看下常规的阻塞io一次io的过程,这里以从文件读取内容然后写到socket为例来看下,如下:

1:发起read调用,发生一次上下文切换,从用户态转换为内核态
2:内核拷贝数据到pagecahe
3:发生一次上下文切换,内核态转换为用户态,用户进程将数据拷贝到用户缓冲区
4:发生一次上下文切换,用户态转换为内核态,内核将数据拷贝socket缓冲区
5:内核将数据拷贝到网卡

pagecache是磁盘数据的缓冲区,用来在一定程度上缓解磁盘速度和内存速度的差异,起到预读,缓存作用。

可以参考下下图:
在这里插入图片描述

这里可能的性能瓶颈如下:

1:上下文切换
2:数据拷贝

所以我们如果是能够尽量上下文切换的次数,以及数据拷贝的次数,就能对性能有比较好的提升了。首先数据拷贝到用户缓冲区这一步,其实是完全没有必要的,因为应用程序只是捣一手而已,所以如果是可以少了这个步骤,那么数据拷贝到用户缓冲区和其之前的上下文切换,以及之后的从用户缓冲区拷贝数据到socket缓冲区以及对应的上下文切换就可以避免了,也就是如下的部分:
在这里插入图片描述

此时,就要需要将数据从pagecache拷贝到socket缓冲区,因此还需要引入额外的一次数据拷贝,但以少两次上下文切换,两次数据拷贝为收益还是比较值得的。整个过程就变为下图:
在这里插入图片描述

黄色框就是新机制额外引入的一次数据拷贝了。

其实,还可以继续优化,如果是应用程序直接告知数据要写到那个socket(这个当然很容易做到),那么就可以直接将数据从pagecache拷贝到网卡,那么新引入的这次拷贝也可以被干掉,并且从socket缓冲区拷贝到网卡这步也可以被干掉了,就变为下图这样的过程:
在这里插入图片描述
这其实就是零拷贝了,所以很难给零拷贝下一个准确的定义。但我觉得可以这样来描述:通过技术手段尽量的减少上下文切换和拷贝次数的io方式叫做零拷贝

2:零拷贝使用的场景

在前面的分析中零拷贝需要依赖于pagecache,而这也决定了零拷贝使用的场景,所以,我们首先要来看下pagecache的作用是什么。pagecache最大的作用是预读,什么意思呢?假定你要读取15k的内容,但是内核会假定你很快读取接下来的15k内容,那么就会直接读取30k的内容,这样接下来的15k内容就不需要读磁盘了,还有一点就是“时间局部性”原理,即刚被读过的数据,被再次读取的概率很高,所以此时pagecache起到了缓存数据的作用。而pagecache的大小是很有限的,所以大文件的读取pagecache是无法发挥它的威力的,甚至会拖后腿,所以,零拷贝的应用场景是小文件的读取。
如果是读取大文件会怎么样呢?就会导致pagecache长时间被占满,并且无法发挥其作用,导致其他小文件的读取也无法享受到pagecache的好处。
所以,如果你的场景中是小文件的读取,或者是小文件频繁的读取可以优先考虑使用零拷贝。

3:jdk对零拷贝的支持

在javaNIO中提供了对零拷贝的支持,依赖于方法java.nio.channels.FileChannel.transferTo

public abstract long transferTo(long position, long count,WritableByteChannel target)throws IOException;

使用实例:

package org.example;//import lombok.extern.slf4j.Slf4j;
//
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.nio.channels.FileChannel;public class TestByteBufferTransferTO {public static void main(String[] args) {long startTime = System.currentTimeMillis();try (FileChannel from = new FileInputStream("d:\\test\\CentOS-7-x86_64-Minimal-2207-02.iso").getChannel();FileChannel to = new FileOutputStream("centos" + System.currentTimeMillis() + ".iso").getChannel()) {long size = from.size();for (long left = size; left > 0; ) {
//                log.info("position:{},left:{}", size - left, left);System.out.println("position:{},left:{}" + (size - left) + left);left -= from.transferTo((size - left), left, to);}} catch (IOException e) {
//            log.debug("e:{}", e);} finally {// 零拷贝耗时:18679System.out.println("零拷贝耗时:" + (System.currentTimeMillis() - startTime));}}
}

运行:
在这里插入图片描述

4:netty对零拷贝的支持

直接包装了jdk的零拷贝,如下:
在这里插入图片描述

写在后面

参考文章列表

04 | 零拷贝:如何高效地传输文件?。

零拷贝原理的文章网上满天飞,但你知道如何使用零拷贝吗?。

http://www.lryc.cn/news/467691.html

相关文章:

  • 开源(open source)是什么?为什么要开源?
  • 基于Spring Boot的论坛网站:从零到部署
  • vue开发的一个小插件vue.js devtools
  • GraphLLM:基于图的框架,通过大型语言模型处理数据
  • HarmonyOS 5.0应用开发——Navigation实现页面路由
  • 物联网行业应用实训室建设方案
  • SOLIDWORKS 2025更灵活零件建模
  • 智能巡检机器人的大模型训练
  • RabbitMQ系列学习笔记(九)--路由模式
  • [OS] pthreads-1
  • ThreeJS入门(137):THREE.StringKeyframeTrack 知识详解,示例代码
  • 用大模型或者向量模型比如huggingface上的模型,处理一批图片,对该图片进行分类,检索
  • Mac 使用 zsh 终端提示 zsh: killed 的问题
  • 数字后端零基础入门系列 | Innovus零基础LAB学习Day6
  • (Linux驱动学习 -13).SPI驱动实验
  • Angular 框架入门教程:从安装到路由、服务与状态管理详解
  • 【华为HCIP实战课程十八】OSPF的外部路由类型,网络工程师
  • oss 简单命令(已亲测)
  • 申请https证书
  • trtexec 工具使用
  • 10款具备强大数据报告功能的电脑监控工具,办公电脑怎么监控
  • 如何理解Linux中的进程名
  • 微信红包设计流程讲解与实战分析
  • AI智能体:AI智能体(Agent)是什么?为什么要学?99%的人不知道!
  • NVR小程序接入平台/设备EasyNVR多个NVR同时管理的高效解决方案
  • APS开源源码解读: 排程工具 optaplanner II
  • 科技是把双刃剑,巧用技术改变财务预测
  • vscode默认添加python项目的源目录路径到执行环境(解决ModuleNotFoundError: No module named问题)
  • 【每日刷题】Day143
  • 基于Springboot智能学习平台的设计与实现