当前位置: 首页 > news >正文

Kappa架构

1.Kappa架构介绍

         Kappa架构由Jay Kreps提出,不同于Lambda同时计算和批计算并合并视图,Kappa只会通过流计算一条的数据链路计算并产生视图。Kappa同样采用了重新处理事件的原则,对于历史数据分析类的需求,Kappa要求数据的长期存储能够以有序日志流的方式重新流入流计算引擎,重新产生历史数据的视图。本质上是通过改进Lambda架构中的Speed Layer,使它既能够进行实时数据处理,同时也有能力在业务逻辑更新的情况下重新处理以前处理过的历史数据。

        Kappa架构的原理就是:在Lambda的基础上进行了优化,删除了Batch Layer的架构,将数据通道以消息队列进行替代。因此对于Kappa架构来说,依旧以流处理为主,但是数据却在数据湖层面进行了存储,当需要进行离线分析或者再次计算的时候,则将数据湖的数据再次经过消息队列重播一次则可。                 

2.Kappa架构的优缺点

         Kappa架构的优点在于将实时和离线代码统一起来,方便维护而且统一了数据口径的问题,避免了Lambda架构中与离线数据合并的问题,查询历史数据的时候只需要重放存储的历史数据即可。而Kappa的缺点也很明显:

        (1)消息中间件缓存的数据量和回溯数据有性能瓶颈。通常算法需要过去180天的数据,如果都存在消息中间件,五一有非常大的压力。同时,一次性回溯订正180天级别的数据,对实时计算的资源消耗也非常大。

        (2)在实时数据处理时,遇到大量不同的实时留进行关联时,非常依赖实时计算系统的能力,很可能因为数据流先后顺序问题,导致数据丢失。

        (3)Kappa在抛弃了离线数据处理模块的时候,同时抛弃了离线计算更叫稳定可靠的特点。Lambda虽然保证了离线计算的稳定性,但双系统的维护成本高且两套代码带来后期运维困难。

http://www.lryc.cn/news/394110.html

相关文章:

  • 护网在即,助力安服仔漏洞扫描~
  • 3C电子制造行业MES系统,提高企业生产效率
  • C++ 多态和虚函数
  • 七月记录上半
  • Wing FTP Server
  • 【Linux进阶】文件系统6——理解文件操作
  • Python编译器的选择
  • Java | Leetcode Java题解之第217题存在重复元素
  • python基础语法 006 内置函数
  • ABAP中BAPI_CURRENCY_CONV_TO_EXTERNAL函数详细的使用方法
  • Mac本地部署大模型-单机运行
  • Qt:8.QWidget属性介绍(focuspolicy属性-控件焦点、stylesheet属性-为控件设置样式)
  • R可视化数据必要格式——长格式
  • Android计算器界面的设计——表格布局TableLayout实操
  • 【数据结构】经典链表题目详解集合(反转链表、相交链表、链表的中间节点、回文链表)
  • 人工智能在软件开发中的角色:助手还是取代者?
  • qt播放视频
  • 搭建论坛和mysql数据库安装和php安装
  • [护网训练]原创应急响应靶机整理集合
  • 【Linux】:程序地址空间
  • c++ 学习面试之路
  • Linux文件结构
  • 【简单介绍下Memcached】
  • 字符串和正则表达式踩坑
  • LLM4Decompile——专门用于反编译的大规模语言模型
  • 关于Web开发的详细介绍
  • G1 垃圾收集器
  • Linux Ubuntu 20.04.06 安装Onboard虚拟键盘教程
  • 简介空间复杂度
  • windows server2016搭建AD域服务器