当前位置: 首页 > news >正文

Debezium系列之:记录一次源头数据库刷数据,造成数据丢失的原因

Debezium系列之:记录一次源头数据库刷数据,造成数据丢失的原因

  • 一、背景
  • 二、查看topic日志信息
  • 三、结论
  • 四、解决方法

一、背景

  • 源头数据库在很短的时间内刷了大量的数据,部分数据在hdfs丢失了
    在这里插入图片描述

  • 理论上debezium数据采集不会丢失,就需要排查数据链路某个节点是否有数据丢失。

  • 数据链路是:debezium——kafka——flume——hdfs

  • 根据经验定位数据在kafka侧丢失,下一面进一步确认是否数据在kafka侧丢失

二、查看topic日志信息

Kafka日志信息如下:

[2025-02-20 23:58:21,009] INFO [Log partition
http://www.lryc.cn/news/541092.html

相关文章:

  • PHP约课健身管理系统小程序源码
  • Java之泛型
  • 图论 之 最小生成树
  • STM32-有关内存堆栈、map文件
  • Linux系统中常见的词GNU是什么意思?
  • 【个人开源】——从零开始在高通手机上部署sd(二)
  • 【MCU驱动开发概述】
  • PC端Linux之虚拟CAN
  • C++:std::thread、条件变量与信号量
  • POI pptx转图片
  • Java File 类
  • 工业通信协议 EtherNet/IP 全面解析
  • 使用docker配置PostgreSQL
  • UITextView删除原有字符串时,光标会上移并且光标会变高
  • python入门 介绍及变量的使用
  • 51单片机-按键
  • Java 8 至 Java 23 版本特性对比表
  • 在wsl环境中配置和开发verilog(一种比较新颖的verilog开发指南)
  • AI学习指南HuggingFace篇-Hugging Face 的核心工具
  • DeepSeek 助力 Vue 开发:打造丝滑的二维码生成(QR Code)
  • QT 引入Quazip和Zlib源码工程到项目中,无需编译成库,跨平台,压缩进度
  • 深入解析桥接模式:软件设计中的解耦利器
  • MYSQL-数据库-DDL-DML-DQL-DCL-基础学习
  • rv1126解码的一些原理
  • 二级公共基础之数据结构与算法篇(七)排序技术
  • 深蕾科技智能多媒体SoC产品助力“DataEye剧查查之夜”微短剧盛会
  • Apache Doris 实现毫秒级查询响应
  • 计算机考研之数据结构:P 问题和 NP 问题
  • 新数据结构(13)——I/O
  • PySide6学习专栏(四):用多线程完成复杂计算任务