当前位置: 首页 > news >正文

【HDFS】Decommision(退役) EC数据节点剩最后几个块卡住的问题

一、背景

近期操作退役EC集群的节点。在退役的过程中,遇到了一些问题。特此总结一下。

本文描述的问题现象是:
每一批次退役10个节点,完全退役成功后开始操作下一批。
但是,中间有一批次有2台节点的Under Replicated Blocks一直是1,不往下降。
处于Decommissioning状态卡住了很久。如果不人为干预的话,会一直卡住,无法退役成功。

二、问题排查、源码分析

1、首先确定卡在了哪个块的复制上。

将 org.apache.hadoop.hdfs.server.blockmanagement.DatanodeAdminManager这个LOG的级别修改为TRACE级别。
这样在DatanodeAdminManager#isSufficient方法里就会有TRACE日志打印出来,告诉我们哪个块有问题。

如下图所示,我们知道卡在了blk_-9223372034543410656_197486297这个块上。

2、 使用fsck -blockId 看看这个块属于哪个文件?
如下图所示。另外我们注意到,此块有一个internal block已经是DECOMMISSIONED状态了(0390节点上那个,这个细节很重要。)

http://www.lryc.cn/news/307797.html

相关文章:

  • MySQL知识点归纳总结(一)
  • SocketWeb实现小小聊天室
  • 如何在启用Secure Boot的Ubuntu 22.04电脑中安装使用VirtualBox 6.1
  • 基于B/S+MySQL+Tomcat开发的旅游信息管理系统
  • mac m3安装nvm安装说明;mac安装xbrew
  • 【小沐学QT】QT学习之Web控件的使用
  • word embedding
  • 原码,反码,补码
  • 科技赋能,MTW400A为农村饮水安全打通“最后一公里”
  • 测试计划、测试方案、测试策略、测试用例的区别
  • c# 异常处理
  • (delphi11最新学习资料) Object Pascal 学习笔记---第6章第3节(传递字符串作为参数)
  • k8s节点负载使用情况分析命令kubectl describe node [node-name]
  • 自动驾驶加速落地,激光雷达放量可期(上)
  • 变量的间接引用
  • 学习JAVA的第六天(基础)
  • LeetCode 2673.使二叉树所有路径值相等的最小代价:自顶向下的DFS 或 自底向上的递推
  • 9、电源管理入门之CPU Idle
  • uniapp的扩展组件uni-popup 弹出层自动打开
  • 二、mysql常用函数
  • 【Redis | 第一篇】快速了解Redis
  • Vim 模式切换 | 命令集
  • 广和通5G智能模组SC171支持Android、Linux和Windows系统,拓宽智能物联网应用
  • 【51单片机】红外遥控红外遥控电机调速(江科大)
  • kubesphere jenkins 流水线 未运行(解决方案)
  • 如何保护服务器的安全
  • Python使用HDL 模拟器实现 FPGA 板卡的仿真验证
  • vue中 input disable后无法触发点击事件
  • 实战一个 Jenkins 构建 CI/CD流水线 的简单配置过程哈
  • 【InternLM 实战营笔记】大模型评测