当前位置: 首页 > news >正文

flink学习-容错机制

checkpoint(检查点)

在flink中最重要的容错机制,就是checkpoint机制,使用checkpoint可以将之前某个时间点的所有的状态进行保存,这个存档就是checkpoint。

检查点的保存

周期性存储保存,间隔时间可以由用户进行指定。
保存时间点应该是整体处理完某一条数据处理完,将这个时间点的状态保存下来。

检查点恢复状态

当发生故障时,需要找到最近一次成功保存的检查点进行数据恢复。

检查点算法

在flink中,采用Channdy-Lamport 算法的分布式快照,可以在不暂停流处理的前提下,经状态备份保存到检查点。
借鉴水位线设计,插入一个特殊数据结构,表示触发检查保存的时间点,算子遇到后就对当前算子内状态进行持久化保存。
在JobManager中有个『检查点协查器』,用以专门协调处理检查点的相关工作。
分布式快照算法
barrier对齐的精准一次
barrier对齐的至少一次
非barrier对齐的精准一次

checkpoint 常用配置

主要是在设置检查点时需要设置周期,已经模式(例如采用精准一次)
超时时间(默认10分钟)
指定检查存储路径
最大checkpoint并发数
最小等待时间间隔
最小等待间隔(上一轮checkpoint结束到下一轮checkpoint开始间的间隔)
取消作业时,checkpoint的数据是否保留在外部系统
允许checkpoint连续失败的次数
非对齐检查点设置后将会自动设置为精准一次。

保存点用途

整体上看可以将保存点看做程序临时保存使用:
版本管理和归档存储
更新Flink版本
更新应用程序
调整并行度
暂停应用程序

状态一致性

状态一致性部分主要分为三种级别
最多一次(At-Most-Once)
至少一次(At-Least-Once)
精准一次(Exactly-Once)
采用两阶段提交可以用来解决分布式场景下的事务,1、上一次检查点完成后,barrier后续的数据开始进行预提交;2、当新的检查点完成时,各个节点进行正式提交。

http://www.lryc.cn/news/374701.html

相关文章:

  • InfluxDB技术分享
  • Windows10安装配置Docker客户端和WSL2与Hyper-V虚拟机
  • EIQ-ABC 分析法在配送中心储位分配中的应用
  • 【安装笔记-20240613-Linux-在 OpenWrt 的 LuCI界面支持命令行调试】
  • React小记(一)_基础部分
  • 40、基于深度学习的线性预测设计(matlab)
  • 【初体验 threejs】【学习】【笔记】hello,正方体 3!
  • 第04章:IDEA的安装与使用
  • [原创][Delphi多线程]使用TMonitor, TEvent和TQueue配合实现TThreadQueue的经典使用案例.
  • 6.12ctf练习
  • 海豚调度异常处理: 使用 arthas 在内存中删除启动失败的工作流
  • 在Qt中,QSerialPort::write(data) 和 readAll() 有什么关联和联系
  • 第 2 章:Spring Framework 中的 IoC 容器
  • 构造函数、实例、原型对象三者之间的关系
  • 人工智能抢走了他们的工作。现在他们得到报酬,让它听起来像人类
  • 大模型微调出错的解决方案(持续更新)
  • 企业多云策略的优势与实施指南
  • vue分页
  • 服务器上设置pnpm环境变量
  • Java中BIO、NIO、AIO详解
  • cloud_enum:一款针对不同平台云环境安全的OSINT工具
  • 图像的对比度和亮度
  • 手撕设计模式——计划生育之单例模式
  • Mac M3 Pro 部署Flink-1.16.3
  • Mysql 的分布式策略
  • 记录一个利用winhex进行图片隐写分离的
  • 压缩映射定理证明
  • Ubuntu20.04.6操作系统安装教程
  • (分治算法3)leecode 53 最大子数组和(最大子段和)
  • 【C++】模板初级