当前位置: 首页 > news >正文

该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系

该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系

这个去集群主机cm界面上看会出现这个错误
排查思路:

  1. 一般比较常见的原因可能是出问题的主机和集群主节点的时间对应不上了。
  2. 还有就是cm agent服务出现问题了

去该主机的后台进行查看

1.1 如果集群配置了ntp时间同步协议

查看问题节点的ntp服务是否正常启动

systemctl status ntpd

[root@cloudcdp02 ~]# systemctl status ntpd
● ntpd.service - Network Time Service
Loaded: loaded (/usr/lib/systemd/system/ntpd.service; enabled; vendor preset: disabled)
Active: active (running) since 一 2024-03-25 00:53:52 CST; 1 weeks 3 days ago
Process: 717 ExecStart=/usr/sbin/ntpd -u ntp:ntp $OPTIONS (code=exited, status=0/SUCCESS)
Main PID: 726 (ntpd)
CGroup: /system.slice/ntpd.service
└─726 /usr/sbin/ntpd -u ntp:ntp -g
3月 25 00:53:52 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c012 02 freq_set kernel 4.576 PPM
3月 25 00:53:52 cloudcdp02.hadoop.com systemd[1]: Started Network Time Service.
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: Listen normally on 4 eth0 172.21.32.231 UDP 123
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: Listen normally on 5 eth0 fe80::f87f:eaff:fe8b:1600 UDP 123
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: new interface(s) found: waking up resolver
3月 25 00:58:21 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c61c 0c clock_step +0.293029 s
3月 25 00:58:21 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c614 04 freq_mode
3月 25 00:58:22 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c618 08 no_sys_peer
3月 25 01:14:01 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c612 02 freq_set kernel 4.919 PPM
3月 25 01:14:01 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c615 05 clock_sync

这种是正常已经启动好的
如果没有启动,就重启一下ntp服务

systemctl start ntpd

在查看一下ntp是否与主节点进行时间同步

ntpq -p

在这里插入图片描述
可以看到remote下面的主机前面有一个*,代表着正在与cloudcdp01进行时间同步,如果 *在local前面,就代表着与本地时间同步

如果offset下面的数字时间偏差太大的话,光靠ntp可能回不过来,这时候需要手动和主节点进行时间同步
手动同步命令

ntpdate -s 主节点ip

重启agent服务

 systemctl restart cloudera-scm-agent.service

1.2. 如果集群没有配置了ntp时间同步协议

查看主节点的时间

date

然后在回到问题节点上面,直接修改问题节点的系统时间,让其与之同步
同步时间

sudo date -s "2024-04-02 12:30:00"

重启agent服务

 systemctl restart cloudera-scm-agent.service

2.如果agent服务出现问题

查看agent服务状态

 systemctl status cloudera-scm-agent.service

如果发现agent服务停止就重新启动一下,如果发现agent服务没有了,就需要重新安装agent服务
重新安装agent服务,直接从主节点的/var/www/html里面发一份agent服务安装包,rpm安装一下就好了
服务安装好后,需要修改agent服务的配置文件,不然会出现agent服务无法识别主机的报错

修改agent服务的配置

#进入配置服务目录
cd /etc/cloudera-scm-agent
#打开配置文件
vim config.ini

修改server_host后面的地址,把localhoust改为主节点ip。

在这里插入图片描述

然后重启agent服务

 systemctl restart cloudera-scm-agent.service
http://www.lryc.cn/news/331534.html

相关文章:

  • 【BUG】No module named ‘dnf‘
  • Ubuntu pycharm配置Conda环境
  • 工作体验记录
  • YOLO火灾烟雾检测数据集:20000多张,yolo标注完整
  • 基于Spring Boot的餐厅点餐系统
  • tkinter控件教程使用说明(三)
  • Electron 打包自定义NSIS脚本为安装向导增加自定义页面增加输入框
  • Idea2023创建Servlet项目
  • Day57:WEB攻防-SSRF服务端请求Gopher伪协议无回显利用黑白盒挖掘业务功能点
  • 【Qt】使用Qt实现Web服务器(十):前端基础
  • 使用vuepress搭建个人的博客(一):基础构建
  • ArcGIS Pro导出布局时去除在线地图水印
  • 启动mysql
  • C++实现二叉搜索树的增删查改(非递归玩法)
  • 软件架构复用
  • 【初阶数据结构】——leetcode:160. 相交链表
  • 【Go】goroutine并发常见的变量覆盖案例
  • 基于SSM+Jsp+Mysql的快递管理系统
  • 如何动态往Spring容器注册/移除bean?
  • C语言交换二进制位的奇数偶数位
  • 爬虫实战三、PyCharm搭建Scrapy开发调试环境
  • 2012年认证杯SPSSPRO杯数学建模C题(第一阶段)碎片化趋势下的奥运会商业模式全过程文档及程序
  • 【Next.js】连接 MongoDB 实现基本的接口
  • 中值滤波算法与SSE2指令集并行优化
  • 2012年认证杯SPSSPRO杯数学建模B题(第二阶段)节能减排全过程文档及程序
  • NOI - OpenJudge - 2.5基本算法之搜索 - 2753:走迷宫 - 超级无敌详细题解(含多个不同算法AC代码)
  • 什么是Redis数据一致性?如何解决?
  • 【办公软件】开发常用网站
  • 车道线检测_Canny算子边缘检测_1
  • kubadm部署kubernetes