当前位置: 首页 > news >正文

Kafka数据可靠性保证

1.生产者发送数据到Topic partition的可靠性保证

  为保证producer发送的数据,能可靠的发送到指定的topic,topic的每个partition收到producer发送的数据后,都需要向producer发送ack(acknowledgement确认收到),如果producer收到ack,就会进行下一轮的发送,否则重新发送数据。

2.Topic partition存储数据的可靠性保证

2.1 副本数据同步策略

方案优点缺点
半数以上完成同步,就发送ack延迟低选举新的leader时,容忍n台节点的故障,需要2n+1个副本
全部完成同步,才发送ack选举新的leader时,容忍n台节点的故障,需要n+1个副本延迟高

Kafka选择了第二种方案,原因:

  • 为了容忍n台节点的故障,第一种方案需要2n+1个副本,而第二种方案只需要n+1个副本,而Kafka的每个分区都有大量的数据,第一种方案会造成大量数据的冗余。
  • 第二种方案的网络延迟会比较高,但网络延迟对Kafka的影响较小。

2.2 ISR队列

  leader收到数据,所有follower都开始同步数据,但有一个follower,因为某种故障,迟迟不能与leader进行同步,那leader就要一直等下去,直到它完成同步,才能发送ack。这个问题怎么解决呢?

Kafka提供的解决方案:ISR队列

  • Leader维护了一个动态的in-sync replica set (ISR),意为和leader保持同步的follower集合。
  • 当ISR中的follower完成数据的同步之后,leader就会给producer发送ack。
  • 如果follower长时间(replica.lag.time.max.ms)未向leader同步数据,则该follower将被踢出ISR。
  • Leader发生故障之后,就会从ISR中选举新的leader。

2.3 ack应答队列

  对于某些不太重要的数据,对数据的可靠性要求不是很高,能够容忍数据的少量丢失,所以没必要等ISR中的follower全部接收成功。

ack参数备注
0partition的leader副本接收到消息还没有写入磁盘就已经返回ack,当leader故障时有可能丢失数据
1partition的leader副本落盘后返回ack,如果在follower副本同步数据之前leader故障,那么将会丢失数据
-1(all)partition的leader和follower副本全部落盘成功后才返回ack。但是如果在follower副本同步完成后,leader副本所在节点发送ack之前,leader副本发生故障,那么会造成数据重复

3.leader和 follower故障处理细节

在这里插入图片描述

  • LEO(Log End Offset) 每个副本最大的offset。
  • HW(High Watermark) 消费者能见到的最大的offset,ISR队列中最小的LEO。
  1. follower故障

      follower发生故障后会被临时踢出ISR,待该follower恢复后,follower会读取本地磁盘记录的上次的HW,并将log文件高于HW的部分截取掉,从HW开始向leader进行同步。等该follower的LEO大于等于该Partition的HW,即follower追上leader之后,就可以重新加入ISR了。

  2. leader故障

      leader发生故障之后,会从ISR中选出一个新的leader,之后,为保证多个副本之间的数据一致性,其余的follower会先将各自的log文件高于HW的部分截掉,然后从新的leader同步数据。

    注意:这只能保证副本之间的数据一致性,并不能保证数据不丢失或者不重复。

http://www.lryc.cn/news/176474.html

相关文章:

  • 基于R的linkET包qcorrplot可视化Mantel test相关性网络热图分析correlation heatmap
  • IOTDB的TsFile底层设计
  • MATLAB算法实战应用案例精讲-【人工智能】边缘计算(补充篇)
  • Linux学习-HIS系统部署(1)
  • Cairo介绍及源码构建安装(3)
  • Mac电脑信息大纲记录软件 OmniOutliner 5 Pro for Mac中文
  • linux设置应用开机自启(通用:mysql、jar、nginx、solr...)
  • Offset Explorer(Kafka消息可视化工具)报invalid hex digit ‘{‘错误解决方法
  • 深度学习:模型训练过程中Trying to backward through the graph a second time解决方案
  • 【数值计算方法】非线性方程(组)和最优化问题的计算方法:非线性方程式求根的二分法、迭代法、Newton 迭代法及其Python实现
  • linux主机名
  • 前端uniapp图片select联动文本切换
  • java - 包装类
  • 防火墙基础
  • 服务断路器_Resilience4j的断路器
  • 微信小程序学习笔记3.0
  • nginx 反向代理 负载均衡 动静分离
  • Codeanalysis(tca)后端二次开发环境搭建
  • JS前端树形Tree数据结构使用
  • Automation Anywhere推出新的生成式AI自动化平台,加速提高企业生产力
  • 电缆隧道在线监测系统:提升电力设施安全与效率的关键
  • Java BigDecimal 详解
  • 简述信息论与采样定理
  • 网络安全之网站常见的攻击方式
  • iOS Swift 拍照识别数字(Recognizing Text in Images)
  • 数学建模:智能优化算法及其python实现
  • monkeyrunner环境搭建和初步用法
  • 2024华为校招面试真题汇总及其解答(一)
  • css调整字体间距 以及让倾斜字体
  • 工具篇 | Gradle入门与使用指南 - 附Github仓库地址