当前位置: 首页 > news >正文

Kafka 保证消息消费全局顺序性

当有消息被生产出来的时候,如果没有指定分区或者指定 key ,那么消费会按照【轮询】的方式均匀地分配到所有可用分区中,但不一定按照分区顺序来分配


我们知道,在 Kafka 中消费者可以订阅一个或多个主题,并被分配一个或多个分区
 


如果一个消费者消费了多个分区,某些场景下消费者需要顺序地消费消息,但消息并不是按照顺序分配给分区的,所以就不一定能够保证消息消费的全局顺序性

比如下图中 Msg0002 消息并不是在 Msg0001 消息之后的,就有可能导致消费者先把 Msg0002 消息给消费, Msg0001 消息才被消费
 


那么这种情况该怎么解决?如何尽可能地保证消息消费的全局顺序性?(即这些消息具有因果关系)要想消费消息 B 必须先消费消息 A

要注意的是,Kafka 的设计目标是提供高吞吐量和低延迟,而不是强制保证全局有序性

所以这篇文章探讨的是需要强调全局顺序性场景下的 Kafka 应用

单分区

最简单粗暴的方法,虽然 Kafka 不能保证全局消费顺序性,但是能够保证分区内的消息顺序性
 


所以我们可以只创建一个分区,并让消费者消费这个分区,这样就能够保证消费的消息是有序的

但是这样做大大降低了吞吐量和处理效率,容易使得性能出现瓶颈

基于 key

在 Kafka 中,基于 key 的消息分配策略是通过消息中的键(key)来确定消息发送到哪个分区

当生产者发送消息时,可以指定一个键(key),Kafka 使用这个键通过哈希算法来确定消息被发送到哪个分区
 


由于相同的 key 就发送到同一分区,这样就能够保证了消费的消息是有序的

然而,如果只有一个消费者消费相同 key 的消息,那么与单分区相比,基于 key 的消息分配策略不会提高吞吐量

因为即使相同 key 的消息在多个分区中,但同一消费者依然只能从一个分区中消费,这并不会增加整体的处理能力。

但如果有多个消费者消费相同 key 的消息,基于 key 的分区策略可以提高消费者并行消费的能力


因为这些消费者可以同时从不同分区中读取消息,从而增加整体的处理速度。这种情况下,基于 key 的消息分配可以提高整体吞吐量

最后总结一下:

  • Kafka 的设计目标是提供高吞吐量和低延迟,而不是强制保证全局有序性,所以Kafka使用多分区的概念,并且只保证单分区有序

  • 如果想要实现消息的全局有序

    • 单分区策略:

      一个主题下只创建一个分区,一个消费者只消费一个分区,但这样做毫无并发性可言,极大降低系统性能

    • 基于 key 的消息分配策略:

      由于相同的 key 就发送到同一分区,这样就能够保证了消费的消息是有序的。然而,如果只有一个消费者消费相同 key 的消息,与前面单分区相比没有什么区别

http://www.lryc.cn/news/253287.html

相关文章:

  • 3分钟在CentOS 7上离线安装Docker
  • GaussDB数据库SQL系列-触发器
  • 网工学习10-IP地址
  • 二百零八、Hive——HiveSQL异常:Select查询数据正常,但SQL语句加上group by查询数据为空
  • Docker—共享应用程序
  • Linux横向移动
  • Ubuntu 20.0 + mysql 8.0 用户和密码修改
  • 看懂lscpu的输出
  • RoPE旋转位置编码浅析
  • 在 SQL Server 中备份和恢复数据库的最佳方法
  • Java8 根据自定义属性去重
  • Netty网络编程
  • 层三交换机解析(Layer 3 Switch)层3交换机
  • expect自动化交互
  • 探究两个互联网时代的差异,Web 2.0 与 Web 3.0 区别
  • c++基本常见错误总结
  • 鸿蒙原生应用/元服务开发-AGC分发如何生成密钥和和证书请求文件
  • Python自动化——driver.switch_to的用法
  • 【Java技术专题】「入门到精通系列教程」深入探索Java特性中泛型技术体系的原理和实战开发指南
  • 基于Java SSM邮局订报管理系统
  • 【优选算法系列】【专题一双指针】第四节.15. 三数之和和18. 四数之和
  • 字符集——带你了解UTF-8的前世今生
  • 数据分析工具比较:Excel vs Python vs R
  • Java基础数据类型
  • Linux-Linux安装JDK及配置环境 及 遇到的问题
  • 后端架构的一些知识
  • golang使用sip实现语音通话
  • 【1day】蓝凌OA 系统custom.jsp 接口任意文件读取漏洞学习
  • OWASP Web 安全测试指南-Web 应用程序安全测试
  • oracle FUNCTION(任意两个时间 之间的工作小时)