当前位置: 首页 > news >正文

hadoop入门介绍及各组件功能运行关系

文章目录

  • Hadoop 组成部分
  • 1.HDFS
  • 2.MapReduce 架构概述
  • 3. yarn 架构概述
  • 4.HDFS、YARN、MapReduce三者关系

Hadoop 组成部分

在这里插入图片描述

1.HDFS

Hadoop Distributed File System,简称 HDFS,是一个分布式文件系统。

HDFS 架构概述
主要分为

  • NameNode (mn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数文件权限),以及每个文件的块列表和块所在的DataNode等。
  • DataNode(dn): 在本地文件系统存储文件块数据,以及块数据的校验和
  • Secondary NameNode(2nn): 每隔一段时间对NameNode元数据备份
    在这里插入图片描述

2.MapReduce 架构概述

MapReduce 将计算过程分为两个阶段:Map 和 Reduce
1)Map 阶段并行处理输入数据
2)Reduce阶段对 Map 结果进行汇总
在这里插入图片描述

3. yarn 架构概述

sa

4.HDFS、YARN、MapReduce三者关系

client 发送一个任务,有yarn去调度任务 ,由resourceManager 下发到nodeManger ,nodeManager在本地创建app mastr ,appMastr去调用MapReduce 的MapTask 去读取HDFS数据并输入 ,然后通过 Reduce Task对 Map Task 读取的数据进行汇总,最终将结果输出到 nameNode 中,同时保存到SecondaryNameNode中
在这里插入图片描述

http://www.lryc.cn/news/15020.html

相关文章:

  • (HP)新手引导使用react-shepherd
  • 数据结构:栈和队列(Leetcode20. 有效的括号+225. 用队列实现栈+232. 用栈实现队列)
  • 22.2.19周赛双周赛(贪心、记忆化搜索...)
  • 2023最新软件测试面试题(带答案)
  • 【C++】类型转换方法
  • 100亿级订单怎么调度,来一个大厂的极品方案
  • C++性能白皮书
  • 华为OD机试 - 黑板上色 | 机试题算法思路 【2023】
  • 如何在六秒内吸引观众的注意力
  • FreeRTOS与UCOSIII任务状态对比
  • 小程序 npm sill idealTree buildDeps 安装一直没反应
  • GPT系列详解:初代GPT
  • 为什么要使用数据库
  • 【单目标优化算法】海鸥优化算法(Matlab代码实现)
  • 筑基六层 —— 整型提升及实用调式技巧
  • 后端前端文件传输2中传出模式
  • 【ZOJ 1067】Color Me Less 题解(vector+开方)
  • 凌恩生物经典文章:孟德尔诞辰200周年,Nature Genetics礼献豌豆高质量精细图谱
  • 进程间通信(二)/共享内存
  • 电路模型和电路定律——“电路分析”
  • 软件工程 | 第一章:软件工程学概述
  • 前端开发页面HEAD作用
  • CSS开发技巧——行为技巧
  • PX4之代码结构
  • 【C++11】可变参数模板(函数模板、类模板)
  • centos安装高版本cmake
  • 重温一下C#的时间类型,并简单写一个定时器功能
  • MYSQL查询语句执行顺序
  • 总结:电容在电路35个基本常识
  • Kroger EDI 855 采购订单确认报文详解