当前位置: 首页 > news >正文

【Ambari】HDFS基于Ambari的常规运维

🦄 个人主页——🎐开着拖拉机回家_大数据运维-CSDN博客 🎐✨🍁

🪁🍁🪁🍁🪁🍁🪁🍁 🪁🍁🪁🍁🪁🍁🪁 🪁🍁🪁🍁🪁🍁🪁🍁🪁🍁🪁🍁

感谢点赞和关注 ,每天进步一点点!加油!

目录

一、 简介

1.1 Ambari介绍

1.2 关于本手册

二、综合运维

2.1 Ambari一览

2.1.1 命令行操作

2.1.2 登入和登出

2.1.3. 管理界面首页

三、服务的管理和运维

3.1 HDFS运维

3.1 启动/停止/删除HDFS服务

3.1.1 HDFS服务的配置

3.1.2 HDFS服务监控


一、 简介


1.1 Ambari介绍


Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Spark等。

1.2 关于本手册


本手册假定您已经通过Ambari完成了HDP的安装,如果您还没有完成安装,请参考:【Ambari】CentOS7.3 内网环境安装Ambari2.7.4+HDP3.1.4(阿里云服务器)_ambari-agent.x86_64.0.2.7.4.0-118下载-CSDN博客。


二、综合运维


您可以在管理界面中可以进行集群、节点和服务级别的管理和运维。在“综合运维”部分,我们将介绍集群和节点级别的管理和运维以及通用的服务管理。

2.1 Ambari一览


Ambari是集群图形化管理应用程序。通过Ambari可视性来控制 Hadoop 集群,您可以轻松地部署、安装、监控和集中操作整个的 HDP集群。如下所示,Ambari承载管理控制台、Web 服务器和应用程序逻辑。它负责安装软件、配置、启动和停止服务,以及管理在集群运行的服务。

Ambari由以下几部分组成:

  • 集群代理(ambari-agent:在集群中的每台主机上都必须安装代理。它负责启动和停止进程,安装、卸载配置、 报警以及监视主机。(Ambari安装时候会自动安装)
  • 元数据库:存储系统的配置和监视日志信息。通常有多个逻辑数据库运行在一个或多个数据库服务器。我们默认使用MySQL关系型数据库。
  • 服务端(ambari-server):Ambari-server集群安装和配置统一的配置和管理,控制集群代理完成整个集群组件的安装和卸载等基本管理。

2.1.1 命令行操作

通过命令行,您可以启动、停止和重启ambari-server服务。

ambari-server start|stop|restart|status

启动、停止和重启ambari-agent及查看当前状态(在对应节点上执行)

ambari-agent start|stop|restart|status

2.1.2 登入和登出

登入

打开客户端浏览器(推荐使用Google Chrome),输入管理节点IP或DNS地址,比如http://192.168.2.161:8180/(192.168.2.161是管理节点IP, 端口号是8080),输入用户名和密码。初次登入时候必须以admin的身份登录,admin的默认密码是admin。

登出

点击用户界面右上角的登入用户名显示下拉式菜单,点击“Sign out”菜单登出系统,如下:

2.1.3. 管理界面首页

管理界面有以下一些重要元素:


三、服务的管理和运维


下面介绍服务相关的管理和运维操作,我们只对HDFS这一个组件的操作进行说明,YARN、HBase等组件操作基本类似,下面我们介绍两种常用的操作:服务重启和配置添加。

3.1 HDFS运维


Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。

3.1.1 启动/停止/删除HDFS服务

在“HDFS”服务主页面上,将鼠标移至HDFS框的右上角“Action”,出现下拉菜单,您可以点击菜单栏中的选项启动、停止、删除该HDFS服务。

如下红框中的启动、停止等操作是针对整个HDFS服务的操作。

单个服务的启动或停止,我们可以选择点击进入”NAMENODE”服务

如下图,我们可以对单个服务“NameNode” 选择 restart、stop等操作

3.1.2 HDFS服务的配置

选择config下的“SETTINGS”可以进行基本的配置,包括NameNode和Datanode内存、NameNode和DataNode数据保存目录等。

如下图,我们将 “NameNode Java heap size”调整为2G后保存

备注操作信息后,选择“save”保存

选择“OK”

选择“PROCESS ANYWAY”

配置修改完成后,需要重启相关服务组件来刷新配置,我们选择 “RESTART All Required”

确定全部重启

等待全部重启完成

ADVANCED中Customer Core-site增加配置

找到 “Customer core-site”

选择“Add Property”

将如下的键值对关系配置到对应的页面,要添加三次

dfs.namenode.replication.max-streams 10

dfs.namenode.replication.max-streams-hard-limit 20

dfs.namenode.replication.work.multiplier.per.iteration 10

添加完成后的配置,添加完成后选择“save”保存

备注操作信息后,选择“save”保存

选择“PROCESS ANYWAY”

配置修改完成后,需要重启相关服务组件来刷新配置,我们选择 “RESTART All Required”

确定全部重启

等待重启完成,重启完成后配置生效。

3.1.3 HDFS服务监控

如下图,Metrics 是监控信息,包括NameNode内存,RPC,Heap、Load、blocks数等监控项。

对于HDFS、HBase、YARN等服务组件,我们上面只列举了重启和配置修改等操作,更多的复杂操作建议联系大数据工程师完成。

http://www.lryc.cn/news/248360.html

相关文章:

  • WIFI模块(esp-01s)获取网络时间与天气信息
  • 03、K-means聚类实现步骤与基于K-means聚类的图像压缩(2)
  • Condition 源码解析
  • acwing算法基础之数学知识--求组合数进阶版
  • 基础算法:大数除以除以13
  • 软件版本区分
  • Redis高可用之主从复制及哨兵模式
  • 代理模式,dk动态代理,cglib动态代理
  • Vue2系列 -- 组件自动化全局注册(require.context)
  • 【华为OD题库-038】支持优先级的对列-java
  • python爱心代码高级
  • 基于SSM+Vue的社区共享食堂管理系统
  • MYSQL基础知识之【修改数据,删除数据】
  • 【机器学习】交叉验证 Cross-validation
  • Pycharm修改文件默认打开方式 + CSV Editor插件使用
  • shiro整合redis
  • HarmonyOS(七)——@BuilderParam装饰器
  • 展开运算符(...)
  • Apache Flink(二):数据架构演变
  • 【C++】类与对象(中)
  • webshell之无扩展免杀
  • 用 VirtualBox 安装 OpenWrt 等 Linux 系统,无法启动的解决办法
  • Windows下搭建Tomcat HTTP服务,发布公网远程访问
  • k8s-daemonset、job、cronjob控制器 6
  • 技术面时,一定要掌握这3个关键点
  • [Linux]进程创建➕进程终止
  • 【隐私计算】算术秘密分享的加法和乘法运算(Beaver Triple预处理)
  • 【LeetCode刷题-字符串】--71.简化路径
  • 数据结构与算法(Java)-树形DP题单
  • C#,《小白学程序》第一课:初识程序,变量,数据与显示