当前位置: 首页 > news >正文

Kafka消费者 TCP管理

Kafka消费者 TCP管理

  • 创建 TCP
    • FindCoordinator
    • 连接协调者
    • 消费数据
  • TCP 连接数
  • 关闭 TCP 连接

消费者的程序入口类是 KafkaConsumer

  • 构建 KafkaConsumer 时 ,不会创建任何 TCP 连接
  • TCP 连接是用 KafkaConsumer.poll 创建

创建 TCP

poll 创建 TCP 的地方 :

  • 发起 FindCoordinator 请求时
  • 连接协调者时
  • 消费数据时

FindCoordinator

协调者 (Coordinator) : 驻留在 Broker 的内存中

  • 负责消费组的组成员管理和各个消费者的位移提交管理
  • 当消费者首次用 poll 时,发送 FindCoordinator 请求到任意个Broker (负载最小) 发送请求,并告知 Broker 的协调者

负载评估 : 消费者连接所有 Broker 中,待发送请求最少

连接协调者

Broker 处理完 FindCoordinator 请求后,会返回 Broker 的协调者

  • 消费者知道协调者后,就对该 Broker 进行 Socket 连接
  • 成功连接协调者后,就能组协调操作,如 : 加入组、等待组分配方案、心跳请求处理、位移获取、位移提交

消费数据

消费者给每个要消费的分区创建与该分区领导者副本所在 Broker 连接的 TCP

  • 例子 : 消费者要消费 5 个分区的数据,这 5 个分区的领导者副本分布在 4 台 Broker 上,那消费者在消费时 ,会与这 4 台 Broker 的创建 Socket 连接

TCP 连接数

消费者创建 3 类 TCP 连接:

  • 确定协调者和获取集群元数据
  • 连接协调者,令其执行组成员管理操作
  • 执行实际的消息获取

Kafka 日志:

# 消费者程序创建的第一个 TCP 连接,用于发送 FindCoordinator 请求
# 消费者创建第一个连接,它连接的 Broker 节点的 ID 是 -1 :
# 消费者不知道 Kafka Broker 的任何信息
[2019-05-27 10:00:54,142] DEBUG [Consumer clientId=consumer-1, groupId=test] Initiating connection to node localhost:9092 (id: -1 rack: null) using address localhost/127.0.0.1 (org.apache.kafka.clients.NetworkClient:944)# 消费者复用上次创建 Socket 连接
# 向 Kafka 发送元数据请求,获取整个集群的信息
[2019-05-27 10:00:54,188] DEBUG [Consumer clientId=consumer-1, groupId=test] Sending metadata request MetadataRequestData(topics=[MetadataRequestTopic(name=‘t4’)], allowAutoTopicCreation=true, includeClusterAuthorizedOperations=false, includeTopicAuthorizedOperations=false) to node localhost:9092 (id: -1 rack: null) (org.apache.kafka.clients.NetworkClient:1097)# 消费者开始发送 FindCoordinator 请求里的 Broker
# 即 localhost:9092,nodeId = -1
[2019-05-27 10:00:54,188] TRACE [Consumer clientId=consumer-1, groupId=test] Sending FIND_COORDINATOR {key=test,key_type=0} with correlation id 0 to node -1 (org.apache.kafka.clients.NetworkClient:496)# 消费者成功协调者的 Broker 信息(node_id = 2) 后,
# 消费者就知道协调者 Broker 的连接信息
[2019-05-27 10:00:54,203] TRACE [Consumer clientId=consumer-1, groupId=test] Completed receive from node -1 for FIND_COORDINATOR with correlation id 0, received {throttle_time_ms=0,error_code=0,error_message=null, node_id=2,host=localhost,port=9094} (org.apache.kafka.clients.NetworkClient:837)# 发第二个 Socket 连接,TCP连接 localhost:9094
# 只有连接协调者后,消费者才能开启消费组的各种功能
[2019-05-27 10:00:54,204] DEBUG [Consumer clientId=consumer-1, groupId=test] Initiating connection to node localhost:9094 (id: 2147483645 rack: null) using address localhost/127.0.0.1 (org.apache.kafka.clients.NetworkClient:944)# 消费者要创建新 TCP 连接,用于实际的消息获取
# 消费分区的领导者副本在哪台 Broker,消费者连接那个 Broker
# 消费者创建 3 个 TCP 连接: 
# 	localhost:9092,localhost:9093 和 localhost:9094
[2019-05-27 10:00:54,237] DEBUG [Consumer clientId=consumer-1, groupId=test] Initiating connection to node localhost:9094 (id: 2 rack: null) using address localhost/127.0.0.1 (org.apache.kafka.clients.NetworkClient:944)[2019-05-27 10:00:54,237] DEBUG [Consumer clientId=consumer-1, groupId=test] Initiating connection to node localhost:9092 (id: 0 rack: null) using address localhost/127.0.0.1 (org.apache.kafka.clients.NetworkClient:944)[2019-05-27 10:00:54,238] DEBUG [Consumer clientId=consumer-1, groupId=test] Initiating connection to node localhost:9093 (id: 1 rack: null) using address localhost/127.0.0.1 (org.apache.kafka.clients.NetworkClient:944)

ID = -1 原因 :

  • 消费者程序(其实也不光是消费者,生产者也是这样的机制)首次启动时,对 Kafka 集群一无所知,因此用 -1 来表示尚未获取到 Broker 数据

ID = 2147483645 原因 :

  • Integer.MAX_VALUE - 协调者的 Broker ID
  • 协调者 ID 是 2,Socket 连接节点 ID = Integer.MAX_VALUE - 2 = 2147483645
  • 这种节点 ID 目的 : 让组协调请求和真正的数据获取请求使用不同的 Socket 连接

关闭 TCP 连接

消费者关闭 Socket :

  • 主动关闭 : 调用 KafkaConsumer.close() ,或执行 kill
  • Kafka 自动关闭 : 由 connection.max.idle.ms 控制 (默认值: 9 分钟),当某个 Socket 连续 9 分钟都没有任何请求,消费者杀掉该 Socket 连接
http://www.lryc.cn/news/35061.html

相关文章:

  • 软考高级备考哪一个类型好些?
  • 2023 HBU 天梯赛第一次测试 题目集
  • 华为OD机试题,用 Java 解【子序列长度】问题
  • 内网环境解决SSL证书问题
  • 数据分析方法01对比分析法
  • 基于SMOKE多模式排放清单处理技术及EDGAR/MEIC清单制作与VOCs排放量核算
  • CSS流动布局-页面自适应
  • 3.Elasticsearch初步进阶
  • 优思学院|六西格玛管理的核心理念是什么?
  • 第十七节 多态
  • [vue]提供一种网站底部备案号样式代码
  • python第四天作业~函数练习
  • linux安装influxdb-rpmyum方式
  • 死锁
  • C++基础了解-05-C++常量
  • 深度学习笔记-2.自动梯度问题
  • 一文读懂倒排序索引涉及的核心概念
  • Java基础算法题
  • 「SAP ABAP」你真的了解OPEN SQL的DML语句吗 (附超详细案例讲解)
  • 数据结构3——线性表2:线性表的顺序结构
  • VMware虚拟机搭建环境通用方法
  • 2.Fully Convolutional Networks for Semantic Segmentation论文记录
  • 深度解析Spring Boot自动装配原理
  • Redis性能分析相关-channel=[id: 0xbee27bd4, L:/127.0.0.1:63156
  • Linux:环境变量
  • Codeforces Round 703 (Div. 2)(A~D)
  • Django项目5——基于tensorflow serving部署深度模型——windows版本
  • MySQL基础篇3
  • 携程 x TiDB丨应对全球业务海量数据增长,一栈式 HTAP 实现架构革新
  • 记一次Kafka warning排查过程