当前位置: 首页 > news >正文

离线数仓中,为什么用两个flume,一个kafka

  1. 实时数仓中,为什么没有零点漂移问题?
    1. 因为flink直接取的事件时间
  2. 用kafka是为了速度快,并且数据不丢,那为什么既用了kafkachannel,也用了kafka,而不只用kafkachannel呢?
    1. 因为需要削峰填谷
  3. 离线数仓中,为什么用两个flume,一个kafka,直接用taildirsource,kafkachannel,hdfssink不行吗?
    1. 不行
    2. kafka可以削峰填谷
    3. 如果用kafkachannel,那么数据写到kafka,只剩event,没有header,无法解决零点漂移问题,而多加一个flume,可以在kafkasource中添加拦截器。
http://www.lryc.cn/news/107174.html

相关文章:

  • p7付费课程笔记6:CMS GC
  • Linux性能分析--cpuinfo的内核实现
  • 鲁大师7月新机性能/流畅/久用榜:骁龙8 Gen2领先版亮相,性能跑分再破新高
  • 【QT学习】01:helloqt
  • 学习gRPC (三)
  • 【html】学习记录
  • 2023年人工智能技术与智慧城市发展白皮书
  • 《Python入门到精通》条件控制 if 语句
  • 如何编写一个易于维护的考试系统源码
  • day 2 |977.有序数组的平方、209.长度最小的子数组、59.螺旋矩阵II
  • 【力扣每日一题】2023.8.2 翻转卡片游戏
  • IDEA设置中文 中文插件
  • Python——调用webdriver.Chrome() 报错
  • 人工智能发展的五个主要技术方向是什么?
  • 机器学习知识经验分享之六:决策树
  • 回归预测 | MATLAB实现SO-CNN-GRU蛇群算法优化卷积门控循环单元多输入单输出回归预测
  • 309. 买卖股票的最佳时机含冷冻期
  • P1119 灾后重建
  • USB采集卡如何打pts
  • 机器学习实战13-超导体材料的临界温度预测与分析(决策树回归,梯度提升回归,随机森林回归和Bagging回归)
  • 小研究 - 一种复杂微服务系统异常行为分析与定位算法(二)
  • Docker 安装 MySQL5.6
  • vue组件跳层级时的事件处理 (事件的广播与派发)
  • 毫米波雷达 TI IWR6843 官方测试程序(Out Of Box Demo)
  • 中大标了 5813万
  • Java电子招投标采购系统源码-适合于招标代理、政府采购、企业采购、等业务的企业 tbms
  • RocketMQ安装和简单使用
  • Codeforces Round 869 (Div. 2)
  • 【雕爷学编程】MicroPython动手做(28)——物联网之Yeelight 3
  • CTFSHOW php 特性