当前位置：首页 > news >正文

十六、YARN和MapReduce配置

news 2025/7/17 7:22:49

1、部署前提

（1）配置前提

已经配置好Hadoop集群。

配置内容：

（2）部署说明

（3）集群规划

2、修改配置文件

MapReduce

（1）修改mapred-env.sh配置文件

export JAVA_HOME=/export/server/jdk
export HADOOP_JOB_HISTORYSERVER_HEAPSIZE=1000
export HADOOP_MAPRED_ROOT_LOGGER=INFO,RFA

（2）修改mapred-site.xml配置文件

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value><description></description></property><property><name>mapreduce.jobhistory.address</name><value>node1:10020</value><description></description></property><property><name>mapreduce.jobhistory.webapp.address</name><value>node1:19888</value><description></description></property><property><name>mapreduce.jobhistory.intermediate-done-dir</name><value>/data/mr-history/tmp</value><description></description></property><property><name>mapreduce.jobhistory.done-dir</name><value>/data/mr-history/done</value><description></description></property><property><name>yarn.app.mapreduce.am.env</name><value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value></property><property><name>mapreduce.map.env</name><value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value></property><property><name>mapreduce.reduce.env</name><value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value></property>
</configuration>

yarn

（1）修改yarn-env.sh文件

export JAVA_HOME=/export/server/jdk
export HADOOP_HOME=/export/server/hadoop
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
# export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop
# export YARN_LOG_DIR=$HADOOP_HOME/logs/yarn
export HADOOP_LOG_DIR=$HADOOP_HOME/logs

（2）修改yarn-site.xml文件

<configuration><!-- Site specific YARN configuration properties -->
<property><name>yarn.log.server.url</name><value>http://node1:19888/jobhistory/logs</value><description></description>
</property><property><name>yarn.web-proxy.address</name><value>node1:8089</value><description>proxy server hostname and port</description></property><property><name>yarn.log-aggregation-enable</name><value>true</value><description>Configuration to enable or disable log aggregation</description></property><property><name>yarn.nodemanager.remote-app-log-dir</name><value>/tmp/logs</value><description>Configuration to enable or disable log aggregation</description></property><!-- Site specific YARN configuration properties --><property><name>yarn.resourcemanager.hostname</name><value>node1</value><description></description></property><property><name>yarn.resourcemanager.scheduler.class</name><value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value><description></description></property><property><name>yarn.nodemanager.local-dirs</name><value>/data/nm-local</value><description>Comma-separated list of paths on the local filesystem where intermediate data is written.</description></property><property><name>yarn.nodemanager.log-dirs</name><value>/data/nm-log</value><description>Comma-separated list of paths on the local filesystem where logs are written.</description></property><property><name>yarn.nodemanager.log.retain-seconds</name><value>10800</value><description>Default time (in seconds) to retain log files on the NodeManager Only applicable if log-aggregation is disabled.</description></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value><description>Shuffle service that needs to be set for Map Reduce applications.</description></property>
</configuration>

分发配置文件

3、开启YARN服务器集群

（1）node1节点，以Hadoop用户，执行如下语句：

//开启Hadoop集群
start-dfs.sh
//开启yarn集群
start-yarn.sh
//因为代理服务器已经在配置文件中配置完毕，但历史服务器需要手动开启
//开启历史服务器
mapred --daemon start historyserver

（2）执行结果展示、

（3）查看YARN的Web-UI页面

打开本地浏览器，输入node1:8088，即可打开本地YARN的Web-UI页面。

4、总结

查看全文

http://www.lryc.cn/news/263322.html

自己动手写编译器:语法解析的基本原理

VS Code解决乱码

宝塔Linux：部署His医疗项目通过jar包的方式

Vim命令大全（超详细，适合反复阅读学习）

爬虫持久化保存

统一大语言模型和知识图谱：如何解决医学大模型-问诊不充分、检查不准确、诊断不完整、治疗方案不全面？

读写分离之同步延迟测试

SpringBoot+OCR 实现PDF 内容识别

Go和Java实现抽象工厂模式

深入理解Java虚拟机---内存分配

计算机网络2

jenkins-Generic Webhook Trigger指定分支构建

源码解析8-QSS原理-案例-Qt的qss特殊设置多个子控件的颜色与伪状态

Nginx+Tomcat实现负载均衡和动静分离

linux系统的u盘/mmc/sd卡等的支持热插拔和自动挂载行为

使用Python将OSS文件免费下载到本地：项目分析和准备工作

从Gitee克隆项目、启动方法

不用再找了，这是大模型实践最全的总结

QT 记录

智能优化算法应用：基于黑寡妇算法3D无线传感器网络(WSN)覆盖优化 - 附代码

VSCode 常用的快捷键和技巧系列（2）

【Hadoop】执行start-dfs.sh启动hadoop集群时，datenode没有启动怎么办

计算机网络（四）

非递归实现的快速排序

windows 安装jenkins

SQL进阶理论篇（十二）：InnoDB中的MVCC是如何实现的？

SpringCloudAliBaba篇之Seata：分布式事务组件理论与实践

在centos7.9上安装Jenkins的安装过程

uni-app基本标签

《PySpark大数据分析实战》-14.云服务模式Databricks介绍基本概念

1、部署前提

（1）配置前提

（2）部署说明

（3）集群规划

2、修改配置文件

MapReduce

（1）修改mapred-env.sh配置文件

（2）修改mapred-site.xml配置文件

yarn

（1）修改yarn-env.sh文件

（2）修改yarn-site.xml文件

分发配置文件

3、开启YARN服务器集群

（1）node1节点，以Hadoop用户，执行如下语句：

（2）执行结果展示、

（3）查看YARN的Web-UI页面

4、总结

相关文章：