当前位置: 首页 > news >正文

读kafka生产端源码,窥kafka设计之道(下)

背景

在上一篇文章《读kafka生产端源码,窥kafka设计之道(上)》 留下了kafka设计上比较优秀的一个点;内存的循环使用。本篇文章准备盘盘它。

好奇

为什么 kafka减少发送消息时向JVM频繁申请内存,就可以降低JVM GC的执行次数?

我们知道网络上传输的都是二进制数据;而在java中想通过socke网络套接字接口发送数据,底层都是用的ByteBuffer。在往网络上发送数据前,先申请块ByteBuffer的内存;然后把数据写入到此ByteBuffer内存中;调用底层socket的write接口,就OK了;大概伪代码流程

   //伪代码//申请内存ByteBuffer buffer = ByteBuffer.allocate(size)//内存里加入数据buffer.put(XXX)//发送数据SocketChannel.write(ByteBuffer src)

ByteBuffer占用的内存,什么时候会被回收了?

答:在jvm进行GC时会被回收;

试想如果上面那段代码执行非常频繁,创建ByteBuffer就会很频繁;创建ByteBuffer很频繁,那么申请内存就会很频繁,申请内存越频繁,内存被占满的时间也就会越来越短,内存满了就只能靠不停的GC进行内存的回收,加以重复使用了。而现代JVM里GC的发展目标之一,就是减少GC的停顿时间。GC优化大师从PS,CMS,G1,到ZGC,都在朝这这个方向在努力。

kafka如何解决这个内存频繁申请和GC 频繁释放的问题了?

如果可以用一句简单的话来总结:那么我想应该是 对ByteBuffer的重复使用。 是的用完了不要丢,也不让jvm 给GC了。 即对进行了网络发送的ByteBuffer进行复用;如果有新的消息要发送,可以从缓存池里获取已有 ByteBuffer;然后往里面写入消息数据;当IO线程把ByteBuffer里的消息发往broker并收到对应的响应后,会把ByteBuffer放回缓存池供下一次需要发送的消息循环使用。
大概流程如下图:
  
1690200082886.png

核心参数和代码

有两个核心参数,可以控制缓存池BufferPool的行为

  • buffer.memory
        缓存池大小,默认32M。如果IO thread发送消息的速率比业务线程生产消息的速度,则会引起业务线程的阻塞,可根据实际情况和jvm大小增大此参数

  • batch.size
        控制每个缓存块ByteBuffer的大小,默认为16K。即一个 BatchRecord里可存的多条消息最大空间

  • ByteBuffer的申请
        
    1690200135293.png

  • ByteBuffer的回收
        
    1690200224143.png

总结

如果要编写一款网络应用程序,或者网络框架的工具,我希望能向kafka一样,能考虑到内存的复用;并且减少对上层应用的影响。  
假设一个应用通过kafka发送50个G的网络数据;那么kafka的缓存池,就节约了10个G内存的申请和回收;由此减少了多少次GC和GC暂停时间了。那么假设有个50个这样的应用了?总的收益又是多少了?  
不是所有的工具都能号称是为应对大数据场景而产生的;kafka做为一款中间件,能比较好的融入大数据生态,kafka的研发人员有自己的独特设计和考虑在支撑这它。

原创不易,请 点赞,关注,留言,转载 4暴击^^

http://www.lryc.cn/news/97068.html

相关文章:

  • Pytorch个人学习记录总结 06
  • Rust之泛型、特性和生命期(四):验证有生存期的引用
  • kubesphere安装中间件
  • zookeeper学习(二) 集群模式安装
  • 选择合适的图表,高效展现数据魅力
  • springboot自动装配
  • python小记-队列
  • SpringBoot——持久化技术
  • Kafka 入门到起飞 - 生产者参数详解 ,什么是生产者确认机制? 什么是ISR? 什么是 OSR?
  • 【文献分享】比目前最先进的模型轻30%!高效多机器人SLAM蒸馏描述符!
  • 【数据动态填充到element表格;将带有标签的数据展示为文本格式】
  • 小程序轮播图的两种后台方式(PHP)--【浅入深出系列008】
  • 使用ComPDFKit PDF SDK 构建iOS PDF阅读器
  • 一套流程6个步骤,教你如何正确采购询价
  • git使用
  • SkyWalking链路追踪-搭建-spring-boot-cloud-单机环境 之《10 分钟快速搭建 SkyWalking 服务》
  • Rabbit MQ整合springBoot
  • Golang 中的 time 包详解(一):time.Time
  • CMU 15-445 -- Database Recovery - 18
  • HTTP Header定制,客户端使用Request,服务器端使用Response
  • Vue 3编写的父子组件示例,包括传递数据和调用父组件方法
  • [ 容器 ] Docker 的数据管理
  • 【环境配置】使用Docker搭建LAMP环境
  • MLIR (Multi-Level Intermediate Representation)
  • VR全景在酒店的发展状况如何?酒店该如何做营销?
  • Winform使用PictureBox控件显示图片并且自适应
  • HTML中的焦点管理
  • 如何区分接口测试和功能测试
  • limit分页查询
  • mysql null 值查询不出来问题