当前位置: 首页 > news >正文

HDFS体系架构文件写入/下载流程

HDFS体系架构

HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)是Hadoop项目中的一个核心组件,旨在以高容错、高吞吐量来处理大规模数据集。它的体系架构由以下几个主要部分组成:Client,NameNode,DataNode,SecondaryNameNode

1.Client:客户端

        1.文件切分
        2.与NameNode交互,获取文件元数据信息
        3.与DataNode交互,读取或写入数据
        4.与HDFS进行交互

2.NameNode:Master(管理者)

        1.管理HDFS的元数据空间
        2.管理block块的映射信息
        3.接受DataNode心跳,管理DataNode信息
        4.处理客户端的读写请求

3.DataNode:Slave(NN下达命令执行实际的操作)

        1. 存储实际的数据块
        2.执行数据块的读写操作
        3.向NameNode发送心跳,以及block块汇报

4.Secondary NameNode 

        1.并非NameNode的热备份,当NameNode停止服务的时候不能马上代替NameNode
        2.辅助NameNode,分担工作量
        3.定期合并fsimage和editslog,推送给NameNode
        4.紧急情况下可以辅助恢复namenode

HDFS写入/下载流程

        客户端 请求 NameNode 创建一个新文件。
        NameNode 检查文件是否已存在,并验证客户端权限。
        NameNode 创建一个新文件条目,返回给客户端数据块的位置信息(即哪些 DataNode 将存储数据块的副本)。
        客户端 按顺序将数据块写入到指定的 DataNode。
        DataNode 将数据块复制到其他 DataNode 以确保副本数量。
        DataNode 向 NameNode 报告已存储的数据块信息。


        客户端 请求 NameNode 读取文件。
        NameNode 返回文件的元数据和数据块位置信息。
        客户端 按顺序从相应的 DataNode 读取数据块。
        客户端 汇总数据块,呈现完整文件。

http://www.lryc.cn/news/397358.html

相关文章:

  • 大模型之战进入新赛季,开始卷应用
  • MySQL8.4.0 LTS安装教程 【小白轻松上手2024年最新长期支持版本MySQL手把手保姆级Windows超详细图文安装教程】
  • Linux 例题及详解
  • 爆款文案管理系统设计
  • FPGA-Verilog-Vivado-软件使用
  • Ambari Hive 创建函数无权限
  • ARM GEC6818 LCD绘图 实心圆 三角形 五角星 任意区域矩形以及旗帜
  • Sentinel-1 Level 1数据处理的详细算法定义(三)
  • 一款永久免费的内网穿透工具——巴比达
  • 翻译|解开LLMs的神秘面纱:他们怎么能做没有受过训练的事情?
  • 代码随想录-DAY⑦-字符串——leetcode 344 | 541 | 151
  • JavaScript(7)——数组
  • Spark RDD优化
  • idea:解决Maven报错 Properties in parent definition are prohibited
  • 代理IP池:解析与应用
  • MQTT是什么,物联网
  • 分布式训练
  • day10:04一文搞懂decode和decoding的区别
  • MechMind结构光相机 采图SDK python调用
  • “学习Pandas中时间序列的基本操作“
  • 常用知识碎片 分页组件的使用(arco-design组件库)
  • WPF 制作一个文字漂浮提示框
  • Node.js_fs模块
  • 使用 Vue 3 实现打字机效果
  • unordered_map和set
  • java:运用字节缓冲输入流将文件中的数据写到集合中
  • 【机器学习】支持向量机与主成分分析在机器学习中的应用
  • SpringBoot项目架构实战之“网关zuul搭建“
  • 发挥储能系统领域优势,海博思创坚定不移推动能源消费革命
  • matlab R2016b安装cplex12.6,测试时cplex出现出现内部错误的解决方法