当前位置：首页 > news >正文

【Ambari】HDFS基于Ambari的常规运维

news 2025/9/12 0:06:17

🦄 个人主页——🎐开着拖拉机回家_大数据运维-CSDN博客 🎐✨🍁

🪁🍁🪁🍁🪁🍁🪁🍁 🪁🍁🪁🍁🪁🍁🪁 🪁🍁🪁🍁🪁🍁🪁🍁🪁🍁🪁🍁

感谢点赞和关注，每天进步一点点！加油！

一、简介

1.1 Ambari介绍

1.2 关于本手册

二、综合运维

2.1 Ambari一览

2.1.1 命令行操作

2.1.2 登入和登出

2.1.3. 管理界面首页

三、服务的管理和运维

3.1 HDFS运维

3.1 启动/停止/删除HDFS服务

3.1.1 HDFS服务的配置

3.1.2 HDFS服务监控

一、简介

1.1 Ambari介绍

Apache Ambari是一种基于Web的工具，支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件，包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Spark等。

1.2 关于本手册

本手册假定您已经通过Ambari完成了HDP的安装，如果您还没有完成安装，请参考：【Ambari】CentOS7.3 内网环境安装Ambari2.7.4+HDP3.1.4（阿里云服务器）_ambari-agent.x86_64.0.2.7.4.0-118下载-CSDN博客。

二、综合运维

您可以在管理界面中可以进行集群、节点和服务级别的管理和运维。在“综合运维”部分，我们将介绍集群和节点级别的管理和运维以及通用的服务管理。

2.1 Ambari一览

Ambari是集群图形化管理应用程序。通过Ambari可视性来控制 Hadoop 集群，您可以轻松地部署、安装、监控和集中操作整个的 HDP集群。如下所示，Ambari承载管理控制台、Web 服务器和应用程序逻辑。它负责安装软件、配置、启动和停止服务，以及管理在集群运行的服务。

Ambari由以下几部分组成:

集群代理（ambari-agent）：在集群中的每台主机上都必须安装代理。它负责启动和停止进程，安装、卸载配置、报警以及监视主机。（Ambari安装时候会自动安装）
元数据库：存储系统的配置和监视日志信息。通常有多个逻辑数据库运行在一个或多个数据库服务器。我们默认使用MySQL关系型数据库。
服务端（ambari-server）：Ambari-server集群安装和配置统一的配置和管理，控制集群代理完成整个集群组件的安装和卸载等基本管理。

2.1.1 命令行操作

通过命令行，您可以启动、停止和重启ambari-server服务。

ambari-server start|stop|restart|status

启动、停止和重启ambari-agent及查看当前状态（在对应节点上执行）

ambari-agent start|stop|restart|status

2.1.2 登入和登出

登入

打开客户端浏览器（推荐使用Google Chrome），输入管理节点IP或DNS地址，比如http://192.168.2.161:8180/（192.168.2.161是管理节点IP, 端口号是8080），输入用户名和密码。初次登入时候必须以admin的身份登录，admin的默认密码是admin。

登出

点击用户界面右上角的登入用户名显示下拉式菜单，点击“Sign out”菜单登出系统，如下：

2.1.3. 管理界面首页

管理界面有以下一些重要元素：

三、服务的管理和运维

下面介绍服务相关的管理和运维操作，我们只对HDFS这一个组件的操作进行说明，YARN、HBase等组件操作基本类似，下面我们介绍两种常用的操作：服务重启和配置添加。

3.1 HDFS运维

Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时，它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统，适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束，来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。

3.1.1 启动/停止/删除HDFS服务

在“HDFS”服务主页面上，将鼠标移至HDFS框的右上角“Action”，出现下拉菜单，您可以点击菜单栏中的选项启动、停止、删除该HDFS服务。

如下红框中的启动、停止等操作是针对整个HDFS服务的操作。

单个服务的启动或停止，我们可以选择点击进入”NAMENODE”服务

如下图，我们可以对单个服务“NameNode” 选择 restart、stop等操作

3.1.2 HDFS服务的配置

选择config下的“SETTINGS”可以进行基本的配置，包括NameNode和Datanode内存、NameNode和DataNode数据保存目录等。

如下图，我们将 “NameNode Java heap size”调整为2G后保存

备注操作信息后，选择“save”保存

选择“OK”

选择“PROCESS ANYWAY”

配置修改完成后，需要重启相关服务组件来刷新配置，我们选择 “RESTART All Required”

确定全部重启

等待全部重启完成

ADVANCED中Customer Core-site增加配置

找到 “Customer core-site”

选择“Add Property”

将如下的键值对关系配置到对应的页面，要添加三次

dfs.namenode.replication.max-streams 10

dfs.namenode.replication.max-streams-hard-limit 20

dfs.namenode.replication.work.multiplier.per.iteration 10