当前位置: 首页 > news >正文

大数据面试题:Hadoop中的几个进程和作用

面试题来源:

《大数据面试题 V4.0》

大数据面试题V3.0,523道题,679页,46w字

可回答:1)启动Hadoop,都会有什么进程

参考答案:

1)NameNode:Master,它是一个主管、管理者

  • 管理HDFS的名称空间;

  • 管理数据块(Block)映射信息;

  • 配置副本策略;

  • 处理客户端读写请求。

2)DataNode:Slave,NameNode下达命令,DataNode执行实际的操作

  • 存储实际的数据块;

  • 执行数据块的读/写操作。

3)Secondary NameNode:并非NameNode的热备。当NameNode挂掉的时候,它并不能马上替换NameNode并提供服务

  • 辅助NameNode,分担其工作量;

  • 定期合并Fsimage和Edits,并推送给NameNode;

  • 在紧急情况下,可辅助恢复NameNode。

4)ResourceManager(JobTracker):

  • 处理客户端请求

  • 监控NodeManager

  • 启动或监控ApplicationMaster

  • 资源的分配与调度

5)NodeManager(TaskTracker):

  • 管理单个节点上的资源

  • 处理来自ResourceManager的命令

  • 处理来自ApplicationMaster的命令

6)JobHistoryServer

  • 负责管理MapReduce作业的历史记录和统计信息

7)HttpServer

  • Hadoop的Web服务器,用于显示各种监控和管理信息

8)DFSZKFailoverController

  • 高可用时它负责监控NN的状态,并及时的把状态信息写入ZK。它通过一个独立线程周期性的调用NN上的一个特定接口来获取NN的健康状态。FC也有选择谁作为Active NN的权利,因为最多只有两个节点,目前选择策略还比较简单(先到先得,轮换)。

9)JournalNode

  • 高可用情况下存放namenode的editlog文件。

http://www.lryc.cn/news/113616.html

相关文章:

  • 题解:ABC276D - Divide by 2 or 3
  • 后台管理系统
  • C++数据结构之平衡二叉搜索树(一)——AVL的实现(zig与zag/左右双旋/3+4重构)
  • 静态库和动态库
  • 用于Voronoi图构建的Fortune算法的C++实现
  • 笔记汇总 | 斯坦福 CS229 机器学习
  • git 版本管理工具 学习笔记
  • Bean基本注解开发和Bean依赖注入注解开发
  • 使用IIS服务器搭建一个网站
  • HCIP 三层交换机
  • 利用python 进行数据分析(第三版)第二章小结
  • 【ASP.NET MVC】使用动软(四)(12)
  • 【web逆向】全报文加密及其登录流程的分析案例
  • MyBatis枚举映射类讨论
  • 微信开发之朋友圈自动点赞的技术实现
  • Linux命令200例:sed对文本进行修改、替换和删除等操作的强大工具(常用)
  • python 合并多个excel文件
  • 【Docker】性能测试监控平台搭建:InfluxDB+Grafana+Jmeter+cAdvisor
  • wordpress日主题Ripro9.0最新二开修正源码下载+美化包和插件
  • fib Model Code史海拾贝
  • 6.7.tensorRT高级(1)-使用onnxruntime进行onnx模型推理过程
  • 360未来安全研究院笔试题
  • Linux SSH 远程连接主机,并执行命令
  • FAST协议详解1 不同数据类型的编码与解码
  • 黑马大数据学习笔记5-案例
  • 网络编程——TCP/IP协议族(IP协议、TCP协议和UDP协议……)
  • Oracle SQL存储过程能够返回表吗
  • 2 Vue使用v-bind来代替{{}}取值
  • 20230807在WIN10下使用python3将TXT文件转换为DOCX(在UTF8编码下转换为DOCX有多一行的瑕疵)
  • Flutter(八)事件处理与通知