当前位置: 首页 > news >正文

flink 使用RocksDB作为状态后端

RocksDB

flink在生产环境中常用RocksDB作为状态后端
1、subtask在taskmanager中作为一个线程运行,如果设置了RocksDB状态后端,RocksDB也会启动一个独立的线程,供subtask来使用。
2、RocksDB是一个kv数据库,因此只能存储flink的键控状态,算子状态还是会放到subtask中。
3、RocksDB会单独占据一块flink内存,它不受JVM GC管控
4、RocksDB会把数据存储到taskmanager所在磁盘上。
5、RocksDB比HashBackend的优点在于,空间大

使用RocksDB

<!-- RocksDB状态后端使用开始 -->
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-statebackend-rocksdb_${scala.version}</artifactId><version>${flink.version}</version>
</dependency>// timer优化
Configuration conf = new Configuration();
ConfigOption<String> timer = ConfigOptions.key("state.backend.rocksdb.timer-service.factory").stringType().noDefaultValue();
conf.set(timer, "HEAP");StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(conf);// 设置rocksdb statebackend,增量模式
// 默认不是增量,会把全量的状态数据保存到hdfs,否则只是同步增连的状态
env.setStateBackend(new EmbeddedRocksDBStateBackend(true));
// 开启checkpoint
env.enableCheckpointing(10000, CheckpointingMode.EXACTLY_ONCE);
// 设置checkpoint的存储路径
env.getCheckpointConfig().setCheckpointStorage("hdfs://hdp01:8020/checkpoints");

RocksDB序列化

rocksdb key value都是基于byte数组进行存储,一个byte数组最大是2^31字节=>2G
如果超过2G会导致状态读取异常。

RocksDB优化

如果使用RocksDB做状态后端,Flink中的定时器(timer-service),也会放到RocksDB中,这样定时器会被频繁访问,导致效率问题,因此可以设置一下,将timer放到heap(内存)上,具体做法见上述代码

http://www.lryc.cn/news/430525.html

相关文章:

  • 【运维高级内容--MySQL】
  • 【仿真与实物设计】基于51单片机设计的打地鼠游戏机——程序源码原理图proteus仿真图PCB设计文档演示视频元件清单等(文末工程资料下载)
  • iPhone设备使用技巧:忘记密码的情况下如何解除iOS 18/17屏幕时间
  • 内网渗透的风行者—Yasso
  • Android13 app后台无法启动Abort background activity starts from
  • Day45 | 99.岛屿数量 深搜 广搜 100.岛屿的最大面积
  • css之grid布局(网格布局)
  • 数据可视化大屏模板-美化图表
  • 【与C++的邂逅】--- 类和对象(中)
  • [数据集][目标检测]瞳孔虹膜检测数据集VOC+YOLO格式8768张2类别
  • Day42 | 739. 每日温度 496.下一个更大元素 I 503.下一个更大元素II
  • 运维大规模K8S集群注意事项
  • 供应链系统源码的关键技术是什么?
  • git 修改远程仓库的 URL
  • 使用图数据库 Neo4j 处理对象之间的关系
  • 使用C#的异步和依赖注入实现网络数据存储
  • tomcat日志文件切割
  • Python将Word文档转为PDF
  • 深入浅出链表
  • Linux核心命令入门
  • 腾讯无界微前端框架介绍
  • Linux——网络(2)
  • 结合量子技术解决数据传输安全
  • 【Rust光年纪】提高开发效率:深入了解Rust语言中的数据库客户端和文件处理库
  • 【自动驾驶】控制算法(一)绪论与前期准备
  • CSDN创作一周年总结
  • World of Warcraft [CLASSIC] the Eye of Eternity [EOE] P1-P2
  • 一键翻译全球:多语言支持下的英文翻译工具
  • 水战再起波澜,“怡宝”要下好怎样一盘棋?
  • 使用maven快速生成打包文件3