当前位置: 首页 > news >正文

Kafka为什么能高效读写数据

1)Kafka 本身是分布式集群,可以采用分区技术,并行度高(生产消费方并行度高);

2)读数据采用稀疏索引,可以快速定位要消费的数据;

3)顺序写磁盘;

        Kafka 的 producer 生产数据,要写入到 log 文件中,写的过程是一直追加到文件末端, 为顺序写。官网有数据表明,同样的磁盘,顺序写能到 600M/s,而随机写只有 100K/s。这与磁盘的机械机构有关,顺序写之所以快,是因为其省去了大量磁头寻址的时间。

       又有如下两个优势: 

        零拷贝:Kafka的数据加工处理操作交由Kafka生产者和Kafka消费者处理。Kafka Broker应用层不关心存储的数据,所以就不用 走应用层,传输效率高。

        PageCache页缓存:Kafka重度依赖底层操作系统提供的PageCache功 能。当上层有写操作时,操作系统只是将数据写入 PageCache。当读操作发生时,先从PageCache中查找,如果找不到,再去磁盘中读取。实际上PageCache是把尽可能多的空闲内存 都当做了磁盘缓存来使用。

http://www.lryc.cn/news/263792.html

相关文章:

  • Flink系列之:Table API Connectors之Debezium
  • 【Python基础】文件读写
  • 电脑风扇控制软件Macs Fan Control mac支持多个型号
  • clangd:Couldn‘t build compiler instance
  • Springboot启动出现Error to process server push response的解决方法
  • P2P网络下分布式文件共享场景的测试
  • 计算机组成原理综合1
  • 探秘 AJAX:让网页变得更智能的异步技术(下)
  • CentOs7.x安装部署SeaTunnelWeb遇到的坑
  • Netlink通信
  • Python打造简单而强大的聊天机器人:详解与实例代码
  • Unity 通过代码将一张大图切成多个小图的方法
  • Spring Cloud Gateway请求路径修改指南:详解ServerWebExchange的完美解决方案及代码示例
  • AI+爬虫 爬虫宝
  • 【matlab】绘制横状双组渐变柱状图
  • 如何下载知网论文、专利的PDF格式
  • SMARTFORMS打印问题
  • uniapp组件和周期的知识点以及怎么使用
  • 【Java JVM】实例对象的创建
  • sectigo多域名通配符证书
  • vue 流光边框矩形圆形容器
  • 明理信息科技打造专属个人或企业知识付费平台,核心功能设计
  • 超结MOS/低压MOS在5G基站电源上的应用-REASUNOS瑞森半导体
  • 字节8年经验之谈 —— 如何从0开始做自动化测试?
  • 深入探索Zookeeper的ZAB协议:分布式系统的核心解析
  • 安捷伦Agilent 34970A数据采集
  • Apache Flume(5):多个agent模型
  • 如何在Ubuntu系统中安装VNC并结合内网穿透实现远程访问桌面
  • JaCoCo 统计度量
  • 我们经常使用的AI技术