当前位置: 首页 > article >正文

Hadoop复习(二)

部署Hadoop

考试不考部署,就复习选择和大题

 

问题 1 单项选择

2 / 2 分

下面哪个是MapReduce的核心配置文件

core-site.xml

hdfs-site.xml

yarn-site.xml

mapred-site.xml

问题 2 单项选择

2 / 2 分

下面哪个是HDFS的核心配置文件

core-site.xml

hdfs-site.xml

yarn-site.xml

mapred-site.xml

问题 3 单项选择

2 / 2 分

下面哪一个不属于Hadoop的部署模式

单机模式

JVM模式

伪分布式模式

完全分布式模式

问题 4 多项选择

2 / 2 分

启动YARN进程后我们可以看到哪些进程?

NameNode

DataNode

SecordaryNameNode

ResourceManager

NodeManager

问题 5 单项选择

2 / 2 分

HDFS URI我们可以从下面哪个配置文件中查看到

core-site.xml

hdfs-site.xml

yarn-site.xml

mapred-site.xml

问题 6 多项选择

2 / 2 分

启动HDFS进程后我们可以看到哪些进程?

NameNode

DataNode

SecondaryNameNode

ResourceManager

NodeManager

问题 7 单项选择

2 / 2 分

启动HDFS进程的命令是哪个?

start-dfs.sh

start-yarn.sh

stop-dfs.sh

stop-yarn.sh

问题 8 单项选择

2 / 2 分

关闭HDFS进程的命令是哪个?

start-dfs.sh

start-yarn.sh

stop-dfs.sh

stop-yarn.sh

问题 9 单项选择

2 / 2 分

关闭YARN进程的命令是哪个?

start-dfs.sh

start-yarn.sh

stop-dfs.sh

stop-yarn.sh

问题 10 单项选择

2 / 2 分

启动YARN进程的命令是哪个?

start-dfs.sh

start-yarn.sh

stop-dfs.sh

stop-yarn.sh

问题 11 单项选择

2 / 2 分

下面哪个是Hadoop的核心配置文件

正确!  

core-site.xml  

hdfs-site.xml 

yarn-site.xml

mapred-site.xml

问题 12 单项选择

2 / 2 分

下面哪个是YARN的核心配置文件

core-site.xml

hdfs-site.xml

yarn-site.xml

mapred-site.xml

简要说明Hadoop的三种模式

独立模式:独立模式是一种在单台计算机的单个JVM进程中模拟Hadoop集群的工作模式,该模式部署的Hadoop集群实际上并不属于分布式文件系统,而是直接读写本地操作系统的文件系统,此模式部署的Hadoop通常用于快速安装并体验Hadoop的功能,并不适用于实际生产环境

伪分布式:伪分布式模式是一种在单台计算机的不同JVM进程中运行Hadoop集群的工作模式,该模式部署的Hadoop集群实际上是一个为分布式系统,因为Hadoop集群的所以守护进程都运行在一台计算机中,并不能体现出分布式的特点,所以伪分布式模式部署的Hadoop通常用于开发环境中进行测试和调试,并不适用于实际生产环境。

完全分布式:完全分布式模式是一种在多台计算机的JVM进程中运行Hadoop集群的工作模式,该模式部署的Hadoop集群属于分布式系统,因为Hadoop集群的每个守护进程都运行在不同的计算机中,所以完全分布式模式部署的Hadoop通常可作为实际生产环境


词频统计


Hadoop格式化
hadoop namenode -format
启动Hadoop
start-all.sh
创建文件word.txt,内容如下:
Hello world
Hello Hadoop
Bye worldBye Hadoop

上传至HDFS的根目录下
hdfs dfs -put word.txt /
统计词频
cd /opt/hadoop/share/hadoop/mapreducehadoop jar hadoop-mapreduce-examples-3.3.5.jar wordcount /word.txt /out
查看结果目录
hdfs dfs -ls /out
这时可看到两个文件,分别是SUCCESS和part-r-00000
统计结果文件即是part-r-00000
查看结果
hdfs dfs -cat /out/part-r-80080

http://www.lryc.cn/news/2397479.html

相关文章:

  • C 语言开发中常见的开发环境
  • vscode命令行debug
  • Matlab作图之 subplot
  • Springboot 项目一启动就获取HttpSession
  • PostgreSQL的扩展 insert_username
  • 【机器学习基础】机器学习入门核心算法:层次聚类算法(AGNES算法和 DIANA算法)
  • Google Play的最新安全变更可能会让一些高级用户无法使用App
  • 深度学习篇---人脸识别中的face-recognition库和深度学习
  • (11)java+ selenium->元素定位之By_tag_name
  • React---day5
  • Java开发之定时器学习
  • HealthBench医疗AI评估基准:技术路径与核心价值深度分析(上)
  • Windows+VSCode搭建小智(xiaozhi)开发环境
  • VueScan Pro v9.8.45.08 一款图像扫描软件,中文绿色便携版
  • FreeRTOS通俗理解指南:基础概念 + 架构+ 内核组件+练手实验
  • Python后端开发实战:从0到1搭建高可用API服务
  • 房屋租赁系统 Java+Vue.js+SpringBoot,包括房屋信息、看房申请、租赁合同、房屋报修、收租信息、维修数据、租客管理、公告管理模块
  • 4、ubuntu系统 | 文本和目录操作函数
  • docker部署ELK,ES开启安全认证
  • ASP.NET MVC添加视图示例
  • 自动驾驶中的路径跟踪:Python实现与技术解析
  • 前端面试题目-高频问题集合
  • MyBatis源码解析:从 Mapper 接口到 SQL 执行的完整链路
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | Form Wave(表单label波动效果)
  • 双目相机深度的误差分析(基线长度和相机焦距的选择)
  • Pytorch Geometric官方例程pytorch_geometric/examples/link_pred.py环境安装教程及图数据集制作
  • React---day6、7
  • hook组件-useEffect、useRef
  • 功能结构整理
  • 企业级开发中的 maven-mvnd 应用实践