当前位置: 首页 > news >正文

Hadoop3.3.4伪分布式环境搭建

文章目录

  • 前言
  • 一、准备
    • 1. 下载Hadoop
    • 2. 配置环境变量
    • 3. 配置免密
  • 二、Hadoop配置
    • 1. hadoop-env.sh
    • 2. hdfs-site.xml
    • 3. core-site.xml
    • 4. mapred-site.xml
    • 5. yarn-site.xml
  • 三、格式化
  • 四、启动


前言

hadoop学习——伪分布式环境——普通用户搭建


一、准备

1. 下载Hadoop

2. 配置环境变量

vi ~/.bash_profile# 增加如下配置
export HADOOP_HOME=/home/install/hadoop-3.3.4
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH# 使配置生效
source ~/.bash_profile

3. 配置免密

二、Hadoop配置

配置的目录是$HADOOP_HOME/etc/hadop

1. hadoop-env.sh

修改JAVA_HOME,设置为JDK所在的位置

# Linux命令行输出 JDK 位置
echo $JAVA_HOME

2. hdfs-site.xml

<!--指定数据冗余份数-->
<property><name>dfs.replication</name><value>1</value>
</property>
<property><name>dfs.http.address</name><value>hadoop01:50070</value>
</property>

3. core-site.xml

 <!--hadoop01是机器名  hostname-->
<property><name>fs.defaultFS</name><value>hdfs://hadoop01:9000</value>
</property>
<!-- hadoop临时目录 -->
<property><name>hadoop.tmp.dir</name><value>/home/install/data/hadoop/HADOOP_TMP_DIR</value><description>Abase for other temporary directories.</description>
</property>
<!--所有用户可访问-->
<property><name>hadoop.proxyuser.hduser.groups</name><value>*</value>
</property>
<!--设置buffer size-->
<property><name>io.file.buffer.size</name><value>131072</value>
</property>
<!--任何IP可访问-->
<property><name>hadoop.proxyuser.hduser.hosts</name><value>*</value>
</property>

4. mapred-site.xml

<property><name>mapreduce.framework.name</name><value>yarn</value>
</property>
<property><name>mapreduce.job.counters.max</name><value>1200000</value>
</property>
<property><name>mapreduce.map.memory.mb</name><value>4096</value>
</property>
<property><name>mapreduce.reduce.memory.mb</name><value>8192</value>
</property>
<property><name>mapreduce.map.java.opts</name><value>-Xmx3072m</value>
</property>
<property><name>mapreduce.reduce.java.opts</name><value>-Xmx6144m</value>
</property>

5. yarn-site.xml

<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value>
</property>
<property><name>yarn.resourcemanager.hostname</name><value>hadoop01</value>
</property>
<property><name>yarn.nodemanager.vmem-pmem-ratio</name><value>4</value>
</property>
<property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value>
</property>
<property><name>yarn.nodemanager.resource.memory-mb</name><value>20480</value>
</property>
<property><name>yarn.scheduler.minimum-allocation-mb</name><value>1024</value>
</property>
<property><name>yarn.scheduler.maximum-allocation-mb</name><value>20480</value>
</property>

三、格式化

hadoop namenode -format

四、启动

# 懒一点的方式
start-all.sh

http://www.lryc.cn/news/520070.html

相关文章:

  • 【VUE 指令学习笔记】
  • 【深度学习】布匹寻边:抓边误差小于3px【附完整链接】
  • 【学习笔记】理解深度学习的基础:机器学习
  • 提升租赁效率的租赁小程序全解析
  • Windows自动化Python pyautogui RPA操作
  • 蓝桥杯_B组_省赛_2022(用作博主自己学习)
  • RK3568 Android 13 内置搜狗输入法小计
  • 单片机Day1
  • 《机器学习》之贝叶斯(Bayes)算法
  • Redis实现高效的负载均衡算法
  • 虚拟文件系统 VFS
  • 基于Android的民宿租赁系统的设计与实现
  • 数据链路层-STP
  • OceanBase环境搭建与熟悉全攻略:开启分布式数据库探索之旅
  • tensor core实现flash_attn_mma_share_kv源码分析
  • 【源码解析】Java NIO 包中的 MappedByteBuffer
  • 【Docker系列】容器内目录显示异常的解决之道
  • echarts:dataZoom属性横向滚动条拖拽不生效
  • 25/1/12 算法笔记 剖析Yolov8底层逻辑
  • Python双指针
  • 1、docker概念和基本使用命令
  • 数据结构与算法之链表: LeetCode 92. 反转链表 II (Ts版)
  • 【PPTist】插入形状、插入图片、插入图表
  • 三台Centos7.9中Docker部署Redis集群
  • Entity 的材质(棋盘、条纹、网格)
  • MACPA:fMRI连接性分析的新工具
  • JavaScript-一份你的前端入门说明书(计算机专业)
  • STM32供电参考设计
  • python+fpdf:创建pdf并实现表格数据写入
  • 亚远景-ASPICE评估:汽车软件项目的过程能力评价