当前位置: 首页 > news >正文

cloudera manager 页面启动nodemanager失败,后端没有启动 8040

nodemanager异常失败后,cloudera manager页面启动nodemanager失败,后端没有启动8040。
问题分析:查看日志hadoop-cmf-yarn-NODEMANAGER-IT-CDH-Node36.log.out 发现
在这里插入图片描述
进程OOM,8042端口注册不上! nodemanager启动就会recovering application。
清理失败app缓存:
rm -rf /data*/yarn/nm/usercache/*
rm -rf /var/lib/hadoop-yarn/yarn-nm-recovery/*
删除cache之后 重启nodemanager正常。
问题分析:
1、由于这台机器上跑大任务,导致内存不足,报警写到/tmp目录下,产生很多大文件,进而导致磁盘不足!
2、nm重启会去cache里面 recovering任务,但是这些任务已经过时导致一直起不来,解决办法就是删除这些cache!!!

http://www.lryc.cn/news/571845.html

相关文章:

  • Python装饰器decorators和pytest夹具fixture详解和使用
  • 【强化学习】【笔记】【ch.10】GRPO / DAPO - 目前最优强化微调算法
  • openEuler安装BenchmarkSQL
  • AI Agent 与 Agentic AI 有何不同?
  • 7.索引库操作
  • 代码随想录算法训练营day8
  • 前端打断点
  • SSRF7 SSRF漏洞的检测方式
  • Uniapp 中根据不同离开页面方式处理 `onHide` 的方法
  • 意法STM32F103C8T6 单片机ARM Cortex-M3 国民MCU 电机控制到物联网专用
  • Ubuntu22.04安装opengauss并配置远程访问、JDBC连接
  • 2025年中总结
  • 项目:Gitlab HSD CI/CD总结
  • 从零Gazebo中实现Cartographer算法建图(新目录)
  • Win11用户尽快删除更新!微软6月又推Bug
  • VGG-19(Visual Geometry Group)模型
  • Linux系统移植11:修改网络驱动
  • 获取jenkins中的构建数据
  • FPGA基础 -- Verilog行为级建模之时序控制
  • markRaw
  • 【java中使用stream处理list数据提取其中的某个字段,并由List<String>转为List<Long>】
  • 爱普特APT32F1104C8T6单片机 高抗干扰+硬件加密双保障
  • 支持向量机(SVM)例题
  • VS Code自动删除末尾空行设置
  • 无需公网IP:Termux+手机+内网穿透实现Minecraft远程多人联机
  • Python从入门到精通
  • Python数据操作
  • Docker搭建RabbitMQ集群环境
  • 机器学习重构光子学设计范式:从智能器件到前沿系统
  • 【力扣每日一题】划分数组并满足最大差限制