当前位置: 首页 > news >正文

HBase 源码阅读(二)

衔接

在上一篇文章中,HMasterCommandLine类中在startMaster();方法中

        // 这里除了启动HMaster之外,还启动一个HRegionServerLocalHBaseCluster cluster = new LocalHBaseCluster(conf, mastersCount, regionServersCount,LocalHMaster.class, HRegionServer.class);// 这里getMaster 会获取到HMaster吧((LocalHMaster)cluster.getMaster(0)).setZKCluster(zooKeeperCluster);cluster.startup();waitOnMasterThreads(cluster);

使用了 cluster.startup(); 对HBase的主要进程进行启动

  public void startup() throws IOException {JVMClusterUtil.startup(this.masterThreads, this.regionThreads);}

1. JVMClusterUtil.java

public static String startup(final List<JVMClusterUtil.MasterThread> masters,final List<JVMClusterUtil.RegionServerThread> regionservers) throws IOException

这个函数上面,显示完成了HMaster的线程初始化,然后等到HMaster的线程初始化后,又调用了HRegionServer的线程初始化,但我发现HMaster线程在执行完run方法后,在run方法最后还执行了一遍super.run(),HMaster多执行了一次HRegionServer.run方法的目的是为了?

ChatGPT回答的可能原因

  1. 继承自公共的父类
  • 在HBase的实现中,HMasterHRegionServer都可能继承自一个共同的父类或实现了相同的接口(例如ThreadRunnable接口),该父类可能定义了一个run()方法,用于执行一些通用的逻辑。
  • HMaster在执行自己的run()方法后调用super.run()时,它可能是在执行父类中的通用逻辑。这种逻辑可能与线程的基础设施或资源管理有关,而不仅仅是特定于HRegionServer的逻辑。
  1. HMasterHRegionServer共享某些功能
  • HMasterHRegionServer虽然在职责上不同,但它们可能共享某些基础功能,比如网络通信、线程管理、资源分配等。父类中的run()方法可能封装了这些通用功能,因此HMaster在完成自己的工作后,调用super.run()来确保这些共享功能得以执行。
  • 这可能解释了为什么在HMasterrun()方法之后还要调用super.run():这是为了确保即使是HMaster,也能够执行一些HRegionServerHMaster共享的初始化或管理任务。
  1. 确保线程生命周期的完整性
  • super.run()的调用可能是为了确保线程的生命周期管理符合预期。例如,在某些实现中,父类的run()方法可能会处理线程的启动、暂停、恢复、终止等状态。如果不调用super.run(),可能会导致线程的状态管理不完整或不正确。

经过在HRegionServer.run 方法print 测试发现,HRegionServer.run在HMaster启动时调用了一次,在HR egionServer 线程启动时又调用了一次

带着这三个内容,我们去看HMaster run方法之后的HRegionServer run方法

2. HMaster.run() 方法

  public void run() {try {//用于控制是否在本地测试时启动一个完整的HBase集群if (!conf.getBoolean("hbase.testing.nocluster", false)) {Threads.setDaemonThreadRunning(new Thread(() -> {try {// 定义端口int infoPort = putUpJettyServer();// 启动MasterManagerstartActiveMasterManager(infoPort);} catch (Throwable t) {// Make sure we log the exception.String error = "Failed to become Active Master";LOG.error(error, t);// Abort should have been called already.if (!isAborted()) {abort(error, t);}}}), getName() + ":becomeActiveMaster");}// Fall in here even if we have been aborted. Need to run the shutdown services and// the super run call will do this for us.super.run();

HMaster的接口只是调用了startActiveMasterManager(infoPort); 对Master的一些基础内容进行初始化(具体内容请看HBase源码阅读(一)),然后又调用了一次HRegionServer的run方法

3. HRegionServer run方法

  1. HMaster.java.,HMaster run()线程启动临近结束后,再调用HRegionServer进程

仔细看HRegionServer.run方法,主要涉及HRegionServer的运行和启动

所以上一章节中的问题应该是第二个选型

  1. HMasterHRegionServer共享某些功能

HMaster 比HRegionServer在HMaster.run中多了一些内容

  • HMasterHRegionServer虽然在职责上不同,但它们可能共享某些基础功能,比如网络通信、线程管理、资源分配等。父类中的run()方法可能封装了这些通用功能,因此HMaster在完成自己的工作后,调用super.run()来确保这些共享功能得以执行。
  • 这可能解释了为什么在HMasterrun()方法之后还要调用super.run():这是为了确保即使是HMaster,也能够执行一些HRegionServerHMaster共享的初始化或管理任务。

4. HRegionServer.handleReportForDutyResponse()

简单过一下,用来启动所有的服务器线程

  1. 设置hostname
  2. 在zookeeper中设置Znode
  3. 初始化文件系统
  4. 设置已经初始化的副本和WAL
  5. 设置线程名称
  6. 启动暂停监视器
  7. 启动复制服务(启动复制源和接收器处理程序。)
  8. log zk的信息,唤醒其他所有等待该RegionServer 启动的其他节点

3.1 暂停监视器

JvmPauseMonitor的作用和功能

  1. 监控JVM暂停事件:
    • JvmPauseMonitor通过定期检查系统时间的变化来判断是否发生了JVM暂停。它会设置一个定时器,每隔一段固定的时间去检测系统的时间戳。如果时间戳的变化超过预期值,这通常意味着JVM暂停事件发生了。
  2. 检测长时间的GC停顿:
    • JVM暂停最常见的原因之一是垃圾收集(GC),尤其是Full GC或长时间的Stop-the-World(STW)事件。JvmPauseMonitor可以帮助检测这些事件,因为它们可能会导致HBase的RegionServer或者HMaster的服务性能下降,甚至导致客户端请求超时。
  3. 日志记录和报警:
    • JvmPauseMonitor检测到异常的暂停(通常超过一定阈值,例如几百毫秒或更长),它会记录警告日志。日志中会包括暂停的时长、可能的原因等信息。这有助于运维人员监控和分析系统的性能问题,尤其是在垃圾回收引起的问题上。
  4. 提高系统可靠性:
    • 通过监控和记录JVM暂停,JvmPauseMonitor帮助识别出可能影响HBase性能的问题,允许系统管理员采取预防或修复措施。尽管JvmPauseMonitor本身不会直接解决这些问题,但它提供了有价值的诊断信息,帮助识别和缓解性能瓶颈。
http://www.lryc.cn/news/431752.html

相关文章:

  • 深度学习每周学习总结N9:transformer复现
  • 数据结构与算法(3)栈和队列
  • 11、Django Admin启用对计算字段的过滤
  • xxl-job升级到springboot3.0 导致页面打不开报错)问题
  • 栈和队列.
  • Parallel.ForEach - 并行处理
  • 【MySQL】初识MySQL—MySQL是啥,以及如何简单操作???
  • LLM应用实战: 产业治理多标签分类
  • 下载Mongodb 4.2.25 版本教程
  • docker拉取redis5.0.5并建立redis集群
  • React16新手教程记录
  • 怎么摆脱非自然链接?
  • 【2024数模国赛赛题思路公开】国赛B题第二套思路丨附可运行代码丨无偿自提
  • P1166 打保龄球
  • [数据集][目标检测]西红柿成熟度检测数据集VOC+YOLO格式3241张5类别
  • 数仓工具—Hive语法之URL 函数
  • c#如何实现触发另外一个文本框的回车事件
  • Vue 中 nextTick 的最主要作用是什么,为什么要有这个 API
  • python科学计算:NumPy 数组的运算
  • SAP B1 基础实操 - 用户定义字段 (UDF)
  • Idea发布springboot项目无法识别到webapp下面的静态资源
  • Redis及其他缓存
  • golang入门
  • Behind the Code:与 Rakic 和 Todorovic 对话 OriginTrail 如何实现 AI 去中心化
  • TS 学习 (持续更新中)
  • el-table使用type=“expand”根据数据条件隐藏展开按钮
  • 9月6日(∠・ω<)⌒☆
  • k8s执行crictl images报错
  • 基于人工智能的音乐情感分类系统
  • MySQL灾难恢复策略:构建稳健的备份与恢复机制