当前位置: 首页 > news >正文

flink实战--⼤状态作业调优实践指南-Flink SQL 作业篇

简介

          作为一种特定领域语言,SQL 的设计初衷是隐藏底层数据处理的复杂性,让用户通过声明式语言来进行数据操作。而Flink SQL 由于其架构的特殊性,在实现层面通常需引入状态后端 配合 checkpoint 来保证计算结果的最终一致性。目前 Flink SQL 生成状态算子的策略由优化器根据配置项 + SQL 语句来推导,想要在处理有状态的大规模数据和性能调优方面游刃有余的话,用户还是需要对 SQL 状态算子生成机制和管理策略有一定了解。

 运行原理:状态算子的产生

基于优化器推导产生的状态算子
状态算子状态清理机制
ChangelogNormalize生命周期 TTL
SinkUpsertMaterlizer
LookupJoin(*)

(1)ChangelogNormalize

ChangelogNormalize 作为一个状态算子,旨在对涉及主键语义的数据变更日志进行标准化处理 [1] 。通过这一算子,可以有效地整合和优化数据变更记录,确保数据的一致性和准确性。该状态算子会在以下两种场景出现 [2] :

  • 使用了带有主键的 upsert 源表

upsert 源表特指在保持主键顺序一致性的前提下,仅产生基于主键的 UPDATE(包括 INSERT 和 UPDATE_AFTERÿ

http://www.lryc.cn/news/366244.html

相关文章:

  • 数据结构:顺序串
  • 掌握复选框(Checkbox)的奥秘:全选与反选功能实现
  • 一篇文章带你搞懂C++引用(建议收藏)
  • 查询SQL:文章浏览1
  • android 在onCreate方法中获得view的宽高
  • SOA主要协议和规范
  • 30、matlab现代滤波:维纳滤波/LMS算法滤波/小波变换滤波
  • HTML5 视频 Vedio 标签详解
  • 三十五篇:数字化转型的引擎:赋能企业的ERP系统全景
  • 利用ArcGIS对长江三角洲地区的gdp水平进行聚类
  • 释放视频潜力:Topaz Video AI for mac/win 一款全新的视频增强与修复利器
  • MongoDB 正则表达式详解:高效数据查询与处理技巧
  • 第二十六章HTML与CSS书写规范
  • 基于FPGA的AD5753(DAC数模转换器)的控制 II(SPI驱动)
  • 【全开源】Java同城服务同城信息同城任务发布平台小程序APP公众号源码
  • [Redis]List类型
  • export 和 export default 的区别
  • 29网课交单平台 epay.php SQL注入漏洞复现
  • 推荐ChatGPT4.0——Code Copilot辅助编程、Diagrams: Show Me绘制UML图、上传PDF并阅读分析
  • rollup.js(入门篇)
  • 【Spring Cloud Alibaba】开源组件Sentinel
  • Android14 WMS-窗口绘制之relayoutWindow流程(一)-Client端
  • JVM学习-Jprofiler
  • Skins
  • 【Meetup】探索Apache SeaTunnel的二次开发与实战案例
  • 嵌入式Linux系统中RTC应用的操作详解
  • Edge 工作区是什么?它都有哪些作用?
  • Docker|了解容器镜像层(1)
  • vue3设置全局变量并获取 全局响应式变量 窗口大小
  • Java——面向对象进阶(一)