当前位置：首页 > news >正文

十一、了解分布式计算

news 2025/7/24 0:35:31

1、什么是（数据）计算？

2、分布式(数据)计算

（1）概念

顾名思义，分布式计算，即以分布式的形式完成数据的统计，得到需要的结果。

分布式数据计算，顾名思义，就是“以多取胜”，如果一个问题使用一台计算机计算需要耗时1天，那我们就是用几百个数据节点来计算。

（2）我们为什么要使用分布式计算？

在计算和处理数据时，我们为什么要使用分布式计算，不能用“计算器”来计算吗？

其实，使用什么方式来处理数据，并不是由我们决定的，是由数据本身决定的。

3、分布式（数据）计算模式

（1）基础模式

~分散——>汇总模式

将一个数据分配给许多服务器，每一个服务器分配到一部分的数据，当它们将数据处理完成，将它们各自处理的数据结果向其中一台服务器进行汇报，由该台服务器做归纳总结。生活中的人口普查就是一个典型的例子。

~中心调度——>步骤执行模型

将一个数据分配给许多服务器，每一个服务器分配到一部分的数据，由一台服务器进行调度，当该台服务器发出“第一阶段”的命令时，各个节点的服务器开始第一阶段数据的计算，在第一阶段数据计算完成后，各个节点之间相互交换数据，再开始第二阶段数据的计算，在最后一个阶段数据计算完成后，由主节点进行汇总结果。

注意：

在第一阶段数据计算结束后，各个节点之间需要交换数据，才能进行下一阶段的计算。

相对于分散——>汇总模式，中心调度——>步骤执行模式，中间各个节点之间会进行交换数据，各个节点负责的数据是动态的，或者某个节点开启下一个阶段计算的要求，是另一个阶段该阶段的计算数据。如工作中的项目经理与项目成员就是一个典型的例子。

（2）常见框架

hadoop系统中的MapReduce使用的就是分散——>汇总框架，但是大数据体系中的一些明星框架，使用的多是中心调度——>步骤执行模式，如Apache Spark，Apache Flink使用的就是中心调度——>步骤执行模式。

4、总结

查看全文

http://www.lryc.cn/news/256317.html

数据结构和算法专题---2、算法思想

在AWS Lambda上部署标准FFmpeg工具——自定义层的方案

prometheus服务发现之consul

基于SSM的鞍山职业技术学院图书借阅管理系统

分布式数据库HBase

快捷切换raw页面到repo页面-Raw2Repo插件

web：[GXYCTF2019]BabyUpload（文件上传、一句话木马、文件过滤）

C++ Div3、Sqrt 函数高性能实现（带汇编指令集）

西南科技大学模拟电子技术实验四（集成运算放大器的线性应用）预习报告

【五分钟】学会利用cv2.resize()函数实现图像缩放

在idea中使用maven创建dynamic web project

【外观模式】SpringBoot集成mail发送邮件

GUAVA 工具类

高云GW1NSR-4C开发板上手使用

androidstudio设置内存

[ 蓝桥杯Web真题 ]-Markdown 文档解析

flask web学习之flask与http（一）

蓝桥杯日期问题

每天一点python——day90

《巫师3》缺失vcomp110.dll如何解决，如何快速修复vcomp110.dll丢失问题

LangChain学习二：提示-实战（上半部分）

SpringBoot集成i18n(多语言)

Volumetric Lights 2 HDRP

蓝桥杯 java基础

火狐，要完了！

在AWS Lambda上部署EC2编译的FFmpeg工具——自定义层的方案