当前位置：首页 > news >正文

hadoop伪分布式环境搭建详解

news 2025/9/9 13:35:32

（操作系统是centos7）

1.更改主机名，设置与ip 的映射关系

hostname //查看主机名
vim /etc/hostname //将里面的主机名更改为master
vim /etc/hosts  //将127.0.0.1后面的主机名更改为master，在后面加入一行IP地址与主机名之间的映射
reboot //重启服务器

2.关闭防火墙

systemctl stop firewalld //关闭防火墙
systemctl disable firewalld //禁用防火墙服务（永久关闭）
firewall-cmd --state //查看防火墙状态

3.创建/usr/data,/usr/apps,将hadoop、jdk上传至/usr/data/

(hadoop、jdk文件链接：https://pan.baidu.com/s/1wal1CSF1oO2h4dkSbceODg 提取码：4zra)

mkdir /usr/data //创建data文件
mkdir /usr/apps //创建apps文件

4.在/usr/data目录下将jdk解压到/usr/apps/

 tar -zxf jdk-8u201-linux-x64.tar.gz -C /usr/apps/

5.设置jdk的环境变量

[root@master apps]# cd ./jdk1.8.0_201/ 
[root@master jdk1.8.0_201]# pwd 
/usr/apps/jdk1.8.0_201  //拿到jdk的路径
[root@master jdk1.8.0_201]#

vim 编辑/etc/profile文件

添加下列语句（赋值时不要有空格，图中有空格）

export JAVA_HOME=/usr/apps/jdk1.8.0_201
export PATH=$PATH:$JAVA_HOME/bin

保存退出。

source /etc/profile //重新加载该文件
java -version //查看jdk版本，检查环境是否设置成功

6.将Hadoop解压到apps下

tar -zxvf hadoop-2.7.1.tar.gz -C /usr/apps/  //-zxvf可以打印解压的东西

7.进入Hadoop主目录下，编辑/etc/hadoop/hadoop-env.sh文件，将jdk路径导入

[root@master data]# cd /usr/apps/hadoop-2.7.1/[root@master hadoop-2.7.1]# cd /etc/hadoop[root@master hadoop]# vim hadoop-env.sh

8.配置4个Hadoop文件

（四个文件全部在hadoop-2.7.1/etc/hadoop/目录下，vim编辑即可）

①core-site.xml

<!-- 指定HADOOP所使用的文件系统schema（URI），HDFS的老大（NameNode）的地址 -->
<property> 
<name>fs.defaultFS</name>
<!-- 指定了客户端访问的主机名“master”，则该主机的hadoop就是namenode节点了--> <value>hdfs://master:9000</value> 
</property>
<!-- 指定hadoop运行时产生文件的存储目录，在Hadoop目录下新建一个data目录 -->  
<property> <name>hadoop.tmp.dir</name> 
<value> /usr/apps/ hadoop-2.7.1 /data</value>
</property>

②hdfs-site.xml

<!-- 指定HDFS副本的数量 -->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>

③mapred-site.xml

先将mapred-site.xml.template复制到 mapred-site.xml中

再进入mapred-site.xml编辑
[root@master hadoop]# cp mapred-site.xml.template mapred-site.xml
[root@master hadoop]# vim mapred-site.xml 
<property> 
<name>mapreduce.framework.name</name> 
<value>yarn</value> 
</property>

④yarn-site.xml

<!-- 指定YARN的老大（ResourceManager）的地址 --> 
<property> 
<name>yarn.resourcemanager.hostname</name> 
<value>master</value> 
</property> 
<!-- reducer获取数据的方式 --> 
<property> 
<name>yarn.nodemanager.aux-services</name> 
<value>mapreduce_shuffle</value> 
</property>

9.进入/etc/profile,导入Hadoop的路径

（更改/etc/profile后，需重新加载，source /etc/profile）

10.格式化namenode

[root@master hadoop-2.7.1]# hadoop namenode -format

11.启动hdfs、yarn

[root@master hadoop-2.7.1]# sbin/start-dfs.sh
[root@master hadoop-2.7.1]# sbin/start-yarn.sh

12.网页端即可访问主机ip，端口50070：

查看全文

http://www.lryc.cn/news/320198.html

day12-SpringBootWeb 登录认证

内外网数据单向导入导出如何提升效率确保安全性？

Spring核心方法：Refresh全解(WebMVC如何装配、关联)

TCP：三次握手四次挥手及相关问题：

链式二叉树--前序中序后序遍历，高度，节点个数问题

HCIA——TCP协议详解

Hadoop大数据应用：Linux 部署 HDFS 分布式集群

纯 CSS 实现文字换行环绕效果

【爬虫逆向】Python逆向采集猫眼电影票房数据

使用Python进行自然语言处理（NLP）：NLTK与Spacy的比较【第133篇—NLTK与Spacy】

学习笔记--在线强化学习与离线强化学习的异同（3）

使用Thymeleaf导出PDF，页眉插入图片与内容重叠？

python网络编程：通过socket实现TCP客户端和服务端

论文阅读——RSGPT

长连接技术

供电系统分类详解

基于centos7的k8s最新版v1.29.2安装教程

【赠书第20期】AI绘画与修图实战：Photoshop+Firefly从入门到精通

如何在并行超算云上玩转PWmat③：使用Q-Flow提交计算的案例演示

html5cssjs代码 017样式示例

Vue.js动画

信号与系统学习笔记——信号的分类

PyTorch深度学习实战（39）——小样本学习

论文阅读——Vision Transformer with Deformable Attention

AJAX概念和axios使用、URL、请求方法和数据提交、HTTP协议、接口、form-serialize插件

【R语言基础操作】