当前位置：首页 > news >正文

2023大数据-架构师案例（八）

news 2025/7/17 2:57:57

Lambda架构

nginx （b） Hbase （c）Spark Streaming （d）Spark （e）MapReduce

（f）ETL （g）MemSQL （h）HDFS （i）Flume （k）数据存储层
（l）kafka数据采集层（m）业务逻辑层

将上面分别填入其中（9分）

1 d spark

2 e MapReduce

3 k 数据存储层

4 g MemSQL

5 h HDFS

6 I kafka

7 flume

8 ETL

解析：

ETL采用Sqoop/Datax来数据迁移到分布式存储文件HDFS，之后通过Spark和MapReduce工具离线计算处理，将结果视图发送到hive数据仓库，将结果存储到HDFS。

Nginx则是用flume采集信息，通过kafka实时数据集成，Spark Steaming计算处理分析，把结果存储到MemSQL/Doris。

合并计算则是用Spark来将批处理和实时处理的数据合并存储到HBase。

数据源：HDFS

批处理层：Offline Hive/MR/Spark

加速层：Flink/Storm

数据迁移：Collector/DataX/Sqoop

服务层：MongoDB/HBase/Redis OneDataAPI

Kappa架构

Kappa则是去掉了批处理层，所以处理历史数据的能力比Lambda架构差点。

业务和技术需求方面：

Lambda架构依赖Hadoop，Spark，Storm技术。

Kappa依赖Flink计算引擎，偏流式计算。

Hadoop里的HDFS是用于海量存储，而MapReduce则是用于海量计算。

查看全文

http://www.lryc.cn/news/416362.html

【Python】Python：探索未来科技的风向标

Java语言程序设计——篇十一（6）

2024年有哪些好用的文件加密软件？十款常用加密软件推荐

书生大模型学习笔记3 - 书生开源大模型链路体系

【竞技宝】奥运会:法国国奥淘汰埃及国奥晋级决赛

C++的STL简介（四）

NIO专题学习（一）

Linux学习笔记：Linux基础知识汇总（个人复习版）

MSR020/MSR040低温漂、低功耗电压基准

一个是生产打包的时候, 一个是本地测试启动的时候,maven如何配置?

Transformers实战05-模型量化

【Python】bytes 和 bytearray 到底是什么类型呢？

Windows10上安装SQL Server 2022 Express

C++11 异常

pip下载lap失败

【Material-UI】Button 中的点击事件处理（Handling clicks）详解

Spring Cache框架（AOP思想）+ Redis实现数据缓存

在Windows编程中，MFC\C++中如何在OnCopyData中传递Vector类型数据？

Java常见面试题-01-java基础

Python爬虫实战：利用代理IP爬取百度翻译

Transformer学习之DETR

场外个股期权是什么品种？可以交易哪些品种？

每日学术速递8.5-3

C#针对kernel32.dll的一些常规使用

Lambda架构

Kappa架构

相关文章：