当前位置: 首页 > news >正文

Hadoop——分布式计算

一、分布式计算概述

1. 什么是计算、分布式计算?

  • 计算:对数据进行处理,使用统计分析等手段得到需要的结果
  • 分布式计算:多台服务器协同工作,共同完成一个计算任务
  1. 2. 分布式计算常见的2种工作模式
  • 分散->汇总  MapReduce就是这种模式)
  1. 将数据分片,多台服务器各自负责一部分数据处理
  2.  然后将各自的结果,进行汇总处理
  3.  最终得到想要的计算结果
  • 中心调度->步骤执行 (大数据体系的SparkFlink等是这种模式)
  • 1. 由一个节点作为中心调度管理者

    2. 将任务划分为几个具体步骤

    3. 管理者安排每个机器执行任务

    4. 最终得到结果数据

 二、MapReduce概述

MapReduce分散->汇总模式的分布式计算框架,开发人员开发相关程序进行分布式数据计算。

MapReduce提供了2个编程接口:

Map
Reduce
http://www.lryc.cn/news/266671.html

相关文章:

  • LaTeX引用参考文献 | Texstudio引用参考文献
  • 如何在Go中使用模板
  • 云原生之深入解析基于FunctionGraph在Serverless领域的FinOps的探索和实践
  • 电子电器架构(E/E)演化 —— 主流主机厂域集中架构概述
  • Python常用的几个函数
  • 【Linux系统基础】(2)在Linux上部署MySQL、RabbitMQ、ElasticSearch等各类软件
  • HarmonyOS4.0系统性深入开发01应用模型的构成要素
  • 线下终端门店调研包含哪些内容
  • 倾斜摄影三维模型数据在行业应用分析
  • Apache Flink 进阶教程(七):网络流控及反压剖析
  • k8s学习 — (DevOps实践)第十三章 DevOps 环境搭建
  • Java_Stream流
  • delphi中,tstringlist使用方法示例
  • 【飞凌 OK113i-C 全志T113-i开发板】视频编解码测试
  • 全部没有问题 (一.5)
  • C++归并排序详解以及代码实现
  • springboot整合JPA 多表关联 :一对多 多对多
  • Python 数据分析 Matplotlib篇 plt.rcParams 字典(第5讲)
  • DeamonSet详解
  • TwIST算法MALTLAB主程序详解
  • Flutter 三: Dart
  • redis基本用法学习(C#调用FreeRedis操作redis)
  • Postman接口测试(超详细整理)
  • 【深入解析spring cloud gateway】12 gateway参数调优与分析
  • Java继承,父类没有无参构造方法时,子类必须要显式调用父类的构造方法
  • Ubuntu 20.04使用Livox Mid-360
  • C语言之冒泡排序
  • 在Linux上安装NVM(Node Version Manager)
  • 常用两种Linux命令生成器
  • 【OAuth2】授权框架的四种授权方式详解