当前位置: 首页 > news >正文

2023大数据-架构师案例(八)

Lambda架构

  1. nginx (b) Hbase (c)Spark Streaming (d)Spark (e)MapReduce

(f)ETL (g)MemSQL  (h)HDFS (i)Flume (k)数据存储层
(l)kafka数据采集层 (m)业务逻辑层

将上面分别填入其中(9分)

1 d spark

2 e MapReduce

3 k 数据存储层

4 g MemSQL

5 h HDFS

6 I kafka

7 flume

8 ETL

解析:

ETL采用Sqoop/Datax来数据迁移到分布式存储文件HDFS,之后通过Spark和MapReduce工具离线计算处理,将结果视图发送到hive数据仓库,将结果存储到HDFS。

Nginx则是用flume采集信息,通过kafka实时数据集成,Spark Steaming计算处理分析,把结果存储到MemSQL/Doris。

合并计算则是用Spark来将批处理和实时处理的数据合并存储到HBase。

数据源:HDFS

批处理层:Offline Hive/MR/Spark

加速层:Flink/Storm

数据迁移:Collector/DataX/Sqoop

服务层:MongoDB/HBase/Redis OneDataAPI

Kappa架构

Kappa则是去掉了批处理层,所以处理历史数据的能力比Lambda架构差点。

业务和技术需求方面:

Lambda架构依赖Hadoop,Spark,Storm技术。

Kappa依赖Flink计算引擎,偏流式计算。

Hadoop里的HDFS是用于海量存储,而MapReduce则是用于海量计算。

http://www.lryc.cn/news/416362.html

相关文章:

  • 【Python】Python:探索未来科技的风向标
  • Java语言程序设计——篇十一(6)
  • 2024年有哪些好用的文件加密软件?十款常用加密软件推荐
  • 书生大模型学习笔记3 - 书生开源大模型链路体系
  • 【竞技宝】奥运会:法国国奥淘汰埃及国奥晋级决赛
  • C++的STL简介(四)
  • NIO专题学习(一)
  • Linux学习笔记:Linux基础知识汇总(个人复习版)
  • MSR020/MSR040低温漂、低功耗电压基准
  • 一个是生产打包的时候, 一个是本地测试启动的时候,maven如何配置?
  • 公文字体包下载
  • 主从备份及安装准备
  • 翻译英文的软件,分享3款翻译神器!
  • 软件测试解读——性能效率测试
  • 【PLC】子程序功能心得
  • Iris for mac 好用的录屏软件
  • Transformers实战05-模型量化
  • 【Python】bytes 和 bytearray 到底是什么类型呢?
  • Windows10上安装SQL Server 2022 Express
  • C++11 异常
  • pip下载lap失败
  • 【Material-UI】Button 中的点击事件处理(Handling clicks)详解
  • Spring Cache框架(AOP思想)+ Redis实现数据缓存
  • 在Windows编程中,MFC\C++中如何在OnCopyData中传递Vector类型数据?
  • Java常见面试题-01-java基础
  • Python爬虫实战:利用代理IP爬取百度翻译
  • Transformer学习之DETR
  • 场外个股期权是什么品种?可以交易哪些品种?
  • 每日学术速递8.5-3
  • C#针对kernel32.dll的一些常规使用