当前位置: 首页 > news >正文

【kafka系列】Topic 与 Partition

Kafka 的 Topic(主题)Partition(分区) 是数据组织的核心概念,它们的映射关系及在 Broker 上的分布直接影响 Kafka 的性能、扩展性和容错能力。以下是详细解析:


一、Topic 与 Partition 的映射关系

  1. Topic 是逻辑分类,Partition 是物理分片
    • Topic:消息的逻辑分类(例如 order_eventsuser_logs),类似于数据库中的表。
    • Partition:每个 Topic 被划分为多个 Partition,每个 Partition 是一个有序的、不可变的消息队列
      • 消息在 Partition 内按顺序追加(有序),但全局无序(不同 Partition 的消息顺序不保证)。
      • Partition 数量在 Topic 创建时指定,后续可增加(但不能减少)。
  1. 分区的核心作用
    • 并行处理:多个 Consumer 可同时消费不同 Partition,提升吞吐量。
    • 水平扩展:通过增加 Partition 数量,可突破单机性能瓶颈。
    • 容错性:每个 Partition 的副本分布在多个 Broker 上,避免单点故障。
  1. 消息写入规则
    • 生产者通过 Partitioner 决定消息写入哪个 Partition,默认策略:
      • 轮询(Round Robin):无 Key 时均匀分配。
      • 哈希 Key(Hash-based):有 Key 时按 Key 的哈希值选择 Partition,保证相同 Key 的消息进入同一 Partition。


二、Partition 在 Broker 上的分布

1. Partition 副本机制
  • 每个 Partition 有多个副本(Replica),分为两类:
    • Leader 副本:处理所有读写请求,是唯一对外服务的副本。
    • Follower 副本:异步从 Leader 同步数据,不处理客户端请求。
  • 副本数(Replication Factor):创建 Topic 时指定(例如 replication-factor=3 表示每个 Partition 有 3 个副本)。
2. Partition 分布策略

Kafka 会尽量将 Partition 的副本均匀分布在不同的 Broker 上,规则如下:

  1. 第一副本分配
    首个副本的分配策略有两种(由 Broker 参数 broker.rack 决定):
    • 无机架感知:轮询或随机选择一个 Broker。
    • 有机架感知:优先选择不同机架的 Broker。
  1. 后续副本分配
    其他副本按顺序分配到与前一副本不同的 Broker(尽量分散)。

示例
假设一个 Kafka 集群有 3 个 Broker(Broker 0、1、2),创建一个 Topic test,参数为 partitions=3replication-factor=2
可能的分布如下:

Partition 0: Leader=Broker0, Replicas=[Broker0, Broker1]
Partition 1: Leader=Broker1, Replicas=[Broker1, Broker2]
Partition 2: Leader=Broker2, Replicas=[Broker2, Broker0]
3. 查看 Partition 分布

使用 Kafka CLI 工具查看 Topic 的 Partition 分布:

bash bin/kafka-topics.sh --describe --topic test --bootstrap-server localhost:9092# 输出示例:
Topic: test	PartitionCount: 3	ReplicationFactor: 2Topic: test	Partition: 0	Leader: 0	Replicas: 0,1	Isr: 0,1Topic: test	Partition: 1	Leader: 1	Replicas: 1,2	Isr: 1,2Topic: test	Partition: 2	Leader: 2	Replicas: 2,0	Isr: 2,0
  • Replicas:该 Partition 的所有副本所在的 Broker ID。
  • Leader:当前处理请求的副本所在的 Broker ID。
  • Isr(In-Sync Replicas):与 Leader 保持同步的副本集合。

三、设计 Partition 分布的关键原则

  1. 均匀分布
    • Partition 的 Leader 应均匀分布在所有 Broker 上,避免单个 Broker 成为性能
http://www.lryc.cn/news/534780.html

相关文章:

  • 大数据项目2:基于hadoop的电影推荐和分析系统设计和实现
  • [笔记] 汇编杂记(持续更新)
  • 同步阻塞IO和多路复用IO(epoll)的性能对比
  • 前端 CSS 动态设置样式::class、:style 等技巧详解
  • qt widget和qml界面集成到一起
  • BUU30 [网鼎杯 2018]Fakebook1
  • 信息科技伦理与道德3-2:智能决策
  • 《代码随想录第二十八天》——回溯算法理论基础、组合问题、组合总和III、电话号码的字母组合
  • PromptSource官方文档翻译
  • USB子系统学习(四)用户态下使用libusb读取鼠标数据
  • Ansible简单介绍及用法
  • 目前推荐的优秀编程学习网站与资源平台,涵盖不同学习方式和受众需求
  • 软件工程-软件需求规格说明(SRS)
  • 运维_Mac环境单体服务Docker部署实战手册
  • UE5.5 PCGFrameWork--GPU CustomHLSL
  • RabbitMQ 如何设置限流?
  • json格式,curl命令,及轻量化处理工具
  • Postman面试问题
  • 【JVM详解四】执行引擎
  • esp32 udp 客户端 广播
  • nginx日志存储access日志和error保留180天,每晚把前一天的日志文件压缩成tar.gz
  • 【Java】多线程和高并发编程(四):阻塞队列(上)基础概念、ArrayBlockingQueue
  • C#控件开发6—旋转按钮
  • 在亚马逊云科技上云原生部署DeepSeek-R1模型(下)
  • C# COM 组件在.NET 平台上的编程介绍
  • 火热的大模型: AIGC架构解析
  • Android LifecycleOwner 闪退,java 继承、多态特性!
  • PHP 完整表单实例
  • 深度学习学习笔记(32周)
  • Web3 开发者的机遇与挑战:技术趋势与职业发展