当前位置: 首页 > news >正文

Hadoop 实战笔记(一) -- Windows 安装 Hadoop 3.x

环境准备

  1. 安装 JAVA 1.8
    Java环境搭建之JDK下载及安装
  2. 下载 Hadoop 3.3.5 安装包
    Hadoop 下载:https://archive.apache.org/dist/hadoop/common/

一、JAVA JDK 环境检查

在这里插入图片描述

二、Hadoop(HDFS)环境搭建

1. 解压安装文件 hadoop-3.3.5.tar

在这里插入图片描述

2. 配置环境变量

HADOOP_HOME:D:\Development\HadoopHADOOP_USER_NAME:rootPath:%HADOOP_HOME%\bin;%HADOOP_HOME%\sbin;

3.配置Hadoop

检查 hadoop-3.3.5\etc\hadoop\hadoop-env.cmd 文件JDK的配置,通常无需改动

set JAVA_HOME=%JAVA_HOME%

如果报错的话配置为 JAVA 安装路径

set JAVA_HOME=C:\PROGRA~1\Java\jdk1.8.0_92

windowsd的cmd不允许设置变量路径带有空格,所以Java的安装目录需要不带空格

修改 hadoop/etc/hadoop/core-site.xml

<configuration><!--指定 namenode 的 hdfs 协议文件系统的通信地址--><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property><!--指定 hadoop 存储临时文件的目录--><property><name>hadoop.tmp.dir</name><value>D:\Development\Hadoop\data\tmp</value></property>
</configuration>

修改 hadoop/etc/hadoop/hdfs-site.xml

<configuration><property><name>dfs.namenode.name.dir</name><value>D:\Development\Hadoop\data\namenode</value></property><property><name>dfs.datanode.data.dir</name><value>D:\Development\Hadoop\data\datanode</value></property><!--由于我们这里搭建是单机版本,所以指定 dfs 的副本系数为 1-->	<property><name>dfs.replication</name><value>1</value></property><property><name>dfs.permissions.enabled</name><value>false</value></property>
</configuration>

4. 格式化NameNode :

第一次启动 Hadoop 时需要进行初始化,进入 ${HADOOP_HOME}/bin/ 目录下,执行以下命令:

进入 hadoop-3.3.5\bin 目录,执行 以下命令

hdfs namenode -format

在这里插入图片描述

5. 启动 HDFS

  • 进入 hadoop/sbin 目录,执行以下命令:
hadoop/sbin/start-dfs.cmdhadoop/sbin/start-yarn.cmd
  • 验证是否启动成功
    方式一:执行 jps 查看 NameNode 和 DataNode 服务是否已经启动:
[../sbin]# jps
5988 Jps
1964 DataNode
4572 NameNode
  • 查看集群状态
    http://localhost:9870/

在这里插入图片描述

三、Hadoop(YARN)环境搭建

1. 修改配置

进入 ${HADOOP_HOME}/etc/hadoop/ 目录下,修改以下配置:

  • 修改 hadoop/etc/hadoop/mapred-site.xml
<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>
  • 修改 hadoop/etc/hadoop/yarn-site.xml
<configuration><!--配置 NodeManager 上运行的附属服务。需要配置成 mapreduce_shuffle 后才可以在 Yarn 上运行 MapReduce 程序。--><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value></property><property><name>yarn.resourcemanager.hostname</name><value>localhost</value></property>
</configuration>

5. 启动服务

  • 进入 hadoop/sbin 目录,执行以下命令:
hadoop/sbin/start-yarn.cmd

6. 验证是否启动成功

  • 方式一:执行 jps 查看 ResourceManagerNodeManager 服务是否已经启动:
4112 Jps
2100 ResourceManager
1964 DataNode
4572 NameNode
4668 NodeManager
  • 方式二:查看 Web UI 界面,端口号为 8088,访问页面:http://localhost:8088/

在这里插入图片描述

参考:

  • Windows安装Hadoop3.x
    https://blog.csdn.net/qq_38628046/article/details/124217768
  • Windows环境下执行hadoop命令出现Error: JAVA_HOME is incorrectly set 解决办法
    https://www.cnblogs.com/zlslch/p/8580446.html
http://www.lryc.cn/news/517829.html

相关文章:

  • AI中的神经元与权重矩阵之间的关系;神经元连接角度看行和列的意义
  • mysql、postgresql、druid链接池踩坑记录
  • NRF24L01模块STM32通信-通信初始化
  • 高比例压缩:Linux 中的压缩命令与技巧
  • LabVIEW软件Bug的定义与修改
  • 基于Springboot + vue实现的办公用品管理系统
  • B+树的原理及实现
  • (四)结合代码初步理解帧缓存(Frame Buffer)概念
  • python注意事项:range遍历越索引现象、列表边遍历边修改出现的问题
  • 【C++】模板与泛型编程(三):重载与模板
  • JavaScript字符串拓展:实用方法与示例全解析
  • 基于html5实现音乐录音播放动画源码
  • 初学stm32 --- ADC模拟/数字转换器工作原理
  • 导航技术的分类
  • C++语言的函数实现
  • 每日一题-两个链表的第一个公共结点
  • 细说STM32F407单片机以轮询方式读写外部SRAM的方法
  • 【3】安装cyclictest和iperf
  • C语言将点分十进制的IP字符串转成4个整数
  • go语言学习 笔记 1(变量,语法,数据类型)
  • 无网络时自动切换备用网络环境
  • 电脑32位和64位之区别(Difference between 32-Bit and 64 Bit Computers)
  • 系统思考—结构影响行为
  • 【算法不挂科】算法期末考试【选择题专项练习】<多单元汇总>
  • 2025.1.8(c++对c语言的扩充——堆区空间,引用,函数)
  • 如何将Yum源修改为本地挂载的ISO镜像
  • salesforce如何在系统里保存密码
  • 函数提升+上下文+内存清理及释放
  • 计算机网络之---计算机网络的性能评估
  • Unity学习之UGUI进阶