当前位置: 首页 > news >正文

用flinkcdc debezium来捕获数据库的删除内容

我在用flinkcdc把数据从sqlserver写到doris

正常情况下sqlserver有删除数据,doris是能捕获到并很快同步删除的。

但是我现在情况是doris做为数仓,数据写到ods,ods的数据还会通过flink计算后写入dwd层,所以此时ods的数据是删除了,但是dwd甚至ads的都没删除,这样就会有脏数据。此时我们就需要去捕获被删除的数据,就要用到debezium插件。

利用cdc把数据从sqlserver发送到kafka,并转为debezium的json格式。

source表正常配,sink-kafka的表配置如下:

然后再拉一个工作流

想获取数据的话,就用如下方式:

很多人不懂op是什么,c是什么,接下来解释下: 

debezium会有四种op的数据,

  • op :表示当前事件的类型,取值为:c表示insert、u表示update、d表示delete、r表示快照read;
  • ts_ms: connector处理该事件的本地时间戳,可以省略;
  • before:变化事件发生之前的值;
  • after:变化事件发生之后的值;
  • source:事件源的结构信息,包括connector版本、事务ID等;

 举个例子:

  • 新增一条数据:
insert into inventory.a values (4, 'n4');

控制台输出的是:

..."payload":{"before":null,"after":{"id":4,"name":"n4"}..."op":"c"...
  • 修改一条数据:
update inventory.a set name = 'n4-upd' where id = 4;

控制台输出的是:

..."payload":{"before":{"id":4,"name":"n4"},"after":{"id":4,"name":"n4-upd"}..."op":"u"...
  • 删除一条数据:
delete from inventory.a where id = 1;

控制台输出的是:

..."payload":{"before":{"id":1,"name":"n1"},"after":null..."op":"d"...

这样就可以获取到被删除的数据,或者是更新前的数据啦~

我在sqlserver测试的时候,发现update一条数据,实际上会先有一条d,然后有一条c。

http://www.lryc.cn/news/287607.html

相关文章:

  • mariadb数据库从入门到精通
  • LabVIEW探测器CAN总线系统
  • 侧输出流(Side Output)
  • Vue 动态组件与异步组件:深入理解与全面应用
  • Zephyr 源码调试
  • 数学建模绘图
  • 代码随想录算法训练营第十天 | 239.滑动窗口最大值、347.前K个高频元素
  • 【Godot4自学手册】第五节用GDScript语言让主人公动起来
  • 被问到Tomcat是什么该怎么回答?他还有一个好帮手JDK你知道吗?
  • 【Web前端实操11】定位实操_照片墙(无序摆放)
  • 图像处理------调整色调
  • 【操作系统】实验七 显示进程列表
  • [实战]加密传输数据解密
  • yarn install 报错 证书过期 Certificate has expired
  • 多流转换 (分流,合流,基于时间的合流——双流联结 )
  • Linux破解密码
  • ABAP 批导demo调用SM30表维护demo
  • Mysql 文件导入与导出
  • 《每天十分钟》-红宝书第4版-迭代器与生成器
  • 1、【vue篇】vue框架快速上手
  • Unity 编辑器篇|(九)编辑器美化类( GUIStyle、GUISkin、EditorStyles) (全面总结 | 建议收藏)
  • Spring Boot Starters
  • Qt防止创建窗口抢焦点
  • shared_ptr 与 unique_ptr 的转换 笔记
  • python windows和linux 文件同步
  • 【数据结构】72变的双端队列
  • kafka为什么不支持读写分离?
  • arcgis 面要素shp数据处理
  • 数轴(0 ~ m)上有n个不同点,最多只能移动一个点,移动到[1, m]中任意一点,求最终最小相邻两个点的距离的最大值是什么
  • BGP路由反射-数据中心IDC项目经验