当前位置: 首页 > news >正文

十一、了解分布式计算

1、什么是(数据)计算?

2、分布式(数据)计算

(1)概念

        顾名思义,分布式计算,即以分布式的形式完成数据的统计,得到需要的结果。

        分布式数据计算,顾名思义,就是“以多取胜”,如果一个问题使用一台计算机计算需要耗时1天,那我们就是用几百个数据节点来计算。

(2)我们为什么要使用分布式计算?

        在计算和处理数据时,我们为什么要使用分布式计算,不能用“计算器”来计算吗?

其实,使用什么方式来处理数据,并不是由我们决定的,是由数据本身决定的。

3、分布式(数据)计算模式

(1)基础模式

~分散——>汇总模式

        将一个数据分配给许多服务器,每一个服务器分配到一部分的数据,当它们将数据处理完成,将它们各自处理的数据结果向其中一台服务器进行汇报,由该台服务器做归纳总结。生活中的人口普查就是一个典型的例子。

~中心调度——>步骤执行模型

        将一个数据分配给许多服务器,每一个服务器分配到一部分的数据,由一台服务器进行调度,当该台服务器发出“第一阶段”的命令时,各个节点的服务器开始第一阶段数据的计算,在第一阶段数据计算完成后,各个节点之间相互交换数据,再开始第二阶段数据的计算,在最后一个阶段数据计算完成后,由主节点进行汇总结果。

        注意:

        在第一阶段数据计算结束后,各个节点之间需要交换数据,才能进行下一阶段的计算。

        相对于分散——>汇总模式,中心调度——>步骤执行模式,中间各个节点之间会进行交换数据,各个节点负责的数据是动态的,或者某个节点开启下一个阶段计算的要求,是另一个阶段该阶段的计算数据。如工作中的项目经理与项目成员就是一个典型的例子。

(2)常见框架

        hadoop系统中的MapReduce使用的就是分散——>汇总框架,但是大数据体系中的一些明星框架,使用的多是中心调度——>步骤执行模式,如Apache Spark,Apache Flink使用的就是中心调度——>步骤执行模式。

4、总结

http://www.lryc.cn/news/256317.html

相关文章:

  • 数据结构和算法专题---2、算法思想
  • 在AWS Lambda上部署标准FFmpeg工具——自定义层的方案
  • prometheus服务发现之consul
  • 基于SSM的鞍山职业技术学院图书借阅管理系统
  • 分布式数据库HBase
  • 快捷切换raw页面到repo页面-Raw2Repo插件
  • web:[GXYCTF2019]BabyUpload(文件上传、一句话木马、文件过滤)
  • C++ Div3、Sqrt 函数高性能实现(带汇编指令集)
  • 西南科技大学模拟电子技术实验四(集成运算放大器的线性应用)预习报告
  • 【五分钟】学会利用cv2.resize()函数实现图像缩放
  • vuepress-----18、图片缩放
  • 前端开发_移动Web+动画
  • 【Python】 生成二维码
  • Qt与Sqlite3
  • 在idea中使用maven创建dynamic web project
  • 【外观模式】SpringBoot集成mail发送邮件
  • GUAVA 工具类
  • 高云GW1NSR-4C开发板上手使用
  • androidstudio设置内存
  • [ 蓝桥杯Web真题 ]-Markdown 文档解析
  • flask web学习之flask与http(一)
  • 蓝桥杯日期问题
  • 每天一点python——day90
  • 《巫师3》缺失vcomp110.dll如何解决,如何快速修复vcomp110.dll丢失问题
  • LangChain学习二:提示-实战(上半部分)
  • SpringBoot集成i18n(多语言)
  • Volumetric Lights 2 HDRP
  • 蓝桥杯 java基础
  • 火狐,要完了!
  • 在AWS Lambda上部署EC2编译的FFmpeg工具——自定义层的方案