当前位置：首页 > news >正文

Kafka为什么能高效读写数据

news 2025/7/29 20:13:24

1）Kafka 本身是分布式集群，可以采用分区技术，并行度高（生产消费方并行度高）；

2）读数据采用稀疏索引，可以快速定位要消费的数据；

3）顺序写磁盘；

Kafka 的 producer 生产数据，要写入到 log 文件中，写的过程是一直追加到文件末端，为顺序写。官网有数据表明，同样的磁盘，顺序写能到 600M/s，而随机写只有 100K/s。这与磁盘的机械机构有关，顺序写之所以快，是因为其省去了大量磁头寻址的时间。

又有如下两个优势：

零拷贝：Kafka的数据加工处理操作交由Kafka生产者和Kafka消费者处理。Kafka Broker应用层不关心存储的数据，所以就不用走应用层，传输效率高。

PageCache页缓存：Kafka重度依赖底层操作系统提供的PageCache功能。当上层有写操作时，操作系统只是将数据写入 PageCache。当读操作发生时，先从PageCache中查找，如果找不到，再去磁盘中读取。实际上PageCache是把尽可能多的空闲内存都当做了磁盘缓存来使用。

http://www.lryc.cn/news/263792.html

相关文章：

Flink系列之：Table API Connectors之Debezium

【Python基础】文件读写

电脑风扇控制软件Macs Fan Control mac支持多个型号

clangd:Couldn‘t build compiler instance

Springboot启动出现Error to process server push response的解决方法

P2P网络下分布式文件共享场景的测试

计算机组成原理综合1

探秘 AJAX：让网页变得更智能的异步技术(下)

CentOs7.x安装部署SeaTunnelWeb遇到的坑

Python打造简单而强大的聊天机器人：详解与实例代码

Unity 通过代码将一张大图切成多个小图的方法

Spring Cloud Gateway请求路径修改指南：详解ServerWebExchange的完美解决方案及代码示例

AI+爬虫爬虫宝

【matlab】绘制横状双组渐变柱状图

如何下载知网论文、专利的PDF格式

SMARTFORMS打印问题

uniapp组件和周期的知识点以及怎么使用

【Java JVM】实例对象的创建

sectigo多域名通配符证书

vue 流光边框矩形圆形容器

明理信息科技打造专属个人或企业知识付费平台，核心功能设计

超结MOS/低压MOS在5G基站电源上的应用-REASUNOS瑞森半导体

字节8年经验之谈 —— 如何从0开始做自动化测试？

深入探索Zookeeper的ZAB协议：分布式系统的核心解析

安捷伦Agilent 34970A数据采集

Apache Flume（5）：多个agent模型

如何在Ubuntu系统中安装VNC并结合内网穿透实现远程访问桌面

JaCoCo 统计度量

我们经常使用的AI技术