当前位置：首页 > news >正文

【博学谷学习记录】大数据课程-学习第七周总结

news 2025/6/28 3:39:41

Hadoop配置文件修改

Hadoop安装主要就是配置文件的修改，一般在主节点进行修改，完毕后scp下发给其他各个从节点机器

文件中设置的是Hadoop运行时需要的环境变量。JAVA_HOME是必须设置的，即使我们当前的系统中设置了JAVA_HOME，它也是不认识的，因为Hadoop即使是在本机上执行，它也是把当前的执行环境当成远程服务器

export JAVA_HOME=/export/server/jdk1.8.0_241#文件最后添加
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

hadoop的核心配置文件，有默认的配置项core-default.xml。
core-default.xml与core-site.xml的功能是一样的，如果在core-site.xml里没有配置的属性，则会自动会获取core-default.xml里的相同属性的值

<property><name>fs.defaultFS</name><value>hdfs://node1:8020</value></property><property><name>hadoop.tmp.dir</name><value>/export/data/hadoop-3.3.0</value>
</property><!-- 设置HDFS web UI用户身份 -->
<property><name>hadoop.http.staticuser.user</name><value>root</value>
</property><!-- 整合hive -->
<property><name>hadoop.proxyuser.root.hosts</name><value>*</value>
</property><property><name>hadoop.proxyuser.root.groups</name><value>*</value>
</property>

HDFS的核心配置文件，有默认的配置项hdfs-default.xml。
hdfs-default.xml与hdfs-site.xml的功能是一样的，如果在hdfs-site.xml里没有配置的属性，则会自动会获取hdfs-default.xml里的相同属性的值

<!-- 指定secondarynamenode运行位置 -->
<property><name>dfs.namenode.secondary.http-address</name><value>node2:50090</value>
</property>

MapReduce的核心配置文件，有默认的配置项mapred-default.xml。
mapred-default.xml与mapred-site.xml的功能是一样的，如果在mapred-site.xml里没有配置的属性，则会自动会获取mapred-default.xml里的相同属性的值

<property><name>mapreduce.framework.name</name><value>yarn</value>
</property><property><name>yarn.app.mapreduce.am.env</name><value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
</property><property><name>mapreduce.map.env</name><value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
</property><property><name>mapreduce.reduce.env</name><value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
</property>

YARN的核心配置文件，有默认的配置项yarn-default.xml。
yarn-default.xml与yarn-site.xml的功能是一样的，如果在yarn-site.xml里没有配置的属性，则会自动会获取yarn-default.xml里的相同属性的值

<!-- 指定YARN的主角色（ResourceManager）的地址 -->
<property><name>yarn.resourcemanager.hostname</name><value>node1</value>
</property><!-- NodeManager上运行的附属服务。需配置成mapreduce_shuffle，才可运行MapReduce程序默认值："" -->
<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value>
</property><!-- 是否将对容器实施物理内存限制 -->
<property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value>
</property><!-- 是否将对容器实施虚拟内存限制。 -->
<property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value>
</property>
<!-- 开启日志聚集 -->
<property><name>yarn.log-aggregation-enable</name><value>true</value>
</property><!-- 设置yarn历史服务器地址 -->
<property><name>yarn.log.server.url</name><value>http://node1:19888/jobhistory/logs</value>
</property><!-- 保存的时间7天 -->
<property><name>yarn.log-aggregation.retain-seconds</name><value>604800</value>
</property>

workers文件里面记录的是集群主机名。主要作用是配合一键启动脚本如start-dfs.sh、stop-yarn.sh用来进行集群启动。这时候workers文件里面的主机标记的就是从节点角色所在的机器

vi workersnode1.itcast.cn
node2.itcast.cn
node3.itcast.cn

查看全文

http://www.lryc.cn/news/3065.html

154、【动态规划】leetcode ——494. 目标和：回溯法+动态规划（C++版本）

MySQL-窗口函数

【C++设计模式】学习笔记（1）：面向对象设计原则

[测开篇]设计测试用例的方法如何正确描述Bug

设计模式学习笔记--单例、建造者、适配器、装饰、外观、组合

English Learning - Day5 L1考前复习 2023.2.10 周五

C. Prepend and Append

javassm超市在线配送管理系统

Scratch少儿编程案例-多模式贪吃蛇（无尽和计时）

谷歌蜘蛛池怎么搭建？Google蜘蛛池可以帮助谷歌排名吗？

Kubernetes集群-部署Java项目

English Learning - Day54 作业打卡 2023.2.8 周三

【Unity题】 1.矩阵旋转，欧拉旋转，四元数旋转各自的优缺点。2.StringBuilder和String的区别

【C++面试问答】搞清楚深拷贝与浅拷贝的区别

day10_面向对象基础

电影订票网站的设计与开发

seata【SAGA模式】代码实践（细节未必完全符合saga的配置，仅参考）

面试题：Java锁机制

Springboot Web开发

分布式事务 | 使用DTM 的Saga 模式

错误代码0xc0000001要怎么解决？如何修复错误

为什么 HTTP PATCH 方法不是幂等的及其延伸

13 Day：实现内核线程

GPU服务器安装显卡驱动、CUDA和cuDNN

结构体变量

Java 多态

九龙证券|一夜暴跌36%，美股走势分化，标普指数创近2月最差周度表现

【数据库】 mysql用户授权详解

【性能】性能测试理论篇_学习笔记_2023/2/11

C语言（输入printf()函数）

Hadoop配置文件修改

相关文章：