当前位置: 首页 > news >正文

Lambda架构

1.Lambda架构对大数据处理系统的理解

         Lambda架构由Storm的作者Nathan Marz提出,其设计目的在于提供一个能满足大数据系统关键特性的架构,包括高容错、低延迟、可扩展等。其整合离线计算与实时计算,融合不可变性、读写分离和复杂性隔离等原则,可集成Hadoop、Kafka、Spark、Storm等各类大数据组件。Lambda是用于同时处理离线和实时数据的,可容错的,可扩展的分布式系统。它具备强鲁棒性,提供低延迟和持续更新。

2.Lambda架构应用场景

        1.机器学习中的Lambda架构

        2.物联网的Lambda架构

        3.流处理和Lambda架构挑战

3.Lambda架构介绍

         如图1所示,Lambda架构可分解为三层即批处理层、加速层和服务层

        (1)批处理层(Batch Layer):存储数据集,Batch Layer在数据集上预先计算查询函数,并构件查询所对应的View。Batch Layer可以很好地处理离线数据,但有很多场景数据是不断实时生成且需要实时查询处理,对于这种情况,Speed Layer更为适合。

        (2)加速层(Speed Layer):Batch Layer处理的最近的增量数据流。Speed Layer为了效率,在接收到新的数据后会不断更新Real-time View,而Batch Layer是根据全体离线数据集直接得到Batch View。

        (3)服务层(Serviing Layer):Serving Layer用于合并Batch View和Real-time View中的结果数据集到最终数据集。        

图1 Lambda架构 

4.Lambda架构优缺点

        1.优点

         (1)容错性好。Lambda架构诶大数据系统提供了更友好的容错能力,一旦发生错误,我们可以修复算法或从头开始重新计算视图。

        (2)查询灵活度高。批处理层允许针对任何数据进行临时查询。

        (3)易伸缩。所有的批处理层、加速层和服务层都很容易扩展。因为它们都是完全分布式的系统,我们可以通过增加新机器来轻松地扩大规模。

        (4)易扩展。添加视图是容易的,只是给主数据添加几个新的函数。

        2.缺点

         (1)全场景覆盖带来的编码开销。

        (2)针对具体场景重新离线训练一遍益处不大。

        (3)重新部署和迁移成本很高。

 

http://www.lryc.cn/news/393391.html

相关文章:

  • 数据库作业day3
  • 计算机网络——数据链路层(以太网扩展、虚拟局域网、高速以太网)
  • Nuxt 项目集成第三方UI组件库(九)
  • vulnhub靶场之Jarbas
  • 解决onlyoffice警告的一些思路
  • 快速上手指南:使用 Minikube 在本地运行 Kubernetes 集群
  • 【C语言】指针(1):入门理解篇
  • 经典双运算放大器LM358
  • adb不插usb线通过wifi调试
  • vulnhub--IMF
  • ePTFE膜(膨体聚四氟乙烯膜)应用前景广阔 本土企业技术水平不断提升
  • C++与C#创建位图,是否需要区分RGB和BGR模式
  • web学习笔记(八十)
  • 深度解析 Raft 分布式一致性协议
  • Android10以上实现获取设备序列号功能
  • 从0到1:培训老师预约小程序开发笔记二
  • 【FFmpeg】av_read_frame函数
  • 女生学计算机好不好?感觉计算机分有点高……?
  • windows10/11 如何开启卓越性能模式
  • JSP WEB开发(二) JavaBean
  • G2.【C语言】EasyX绘制颜色窗口
  • 异构计算技术与DTK异构开发套件
  • 数据结构之“栈”(全方位认识)
  • vue项目打包部署后 浏览器自动清除缓存问题(解决方法)
  • 解决vscode配置C++编译带有中文名称报错问题
  • A61 STM32_HAL库函数 之 TIM扩展驱动 -- C -- 所有函数的介绍及使用
  • 使用瀚高数据库开发管理工具进行数据的备份与恢复---国产瀚高数据库工作笔记008
  • css 选择器汇总
  • My Greedy Algorithm(贪心算法)之路(一)
  • Win11 Python3.10 安装pytorch3d