当前位置: 首页 > news >正文

大数据之LibrA数据库系统告警处理(ALM-12027 主机PID使用率超过阈值)

告警解释

系统每30秒周期性检测PID使用率,并把实际PID使用率和阈值进行比较,PID使用率默认提供一个阈值。当检测到PID使用率超出阈值时产生该告警。

平滑次数为1,主机PID使用率小于或等于阈值时,告警恢复;平滑次数大于1,主机PID使用率小于或等于阈值的90%时,告警恢复。

告警属性

告警ID

告警级别

可自动清除

12027

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

产生告警的主机名。

Trigger Condition

系统当前指标取值满足自定义的告警设置条件。

对系统的影响

无法分配PID给新的业务进程,业务进程不可用。

可能原因
  • 节点同时运行的进程过多,需要扩展pid_max值。
  • 系统环境异常。
处理步骤

扩展pid_max值。

  1. 打开FusionInsight Manager页面,在实时告警列表中,单击此告警。在“告警详情”区域,获取告警所在主机IP地址。
  2. 使用PuTTY工具,以root用户登录告警所在主机。
  3. 执行命令cat /proc/sys/kernel/pid_max,查看系统当前运行的PID最大值pid_max。
  4. 若PID使用率超过阈值,将pid_max值增大一倍,执行命令echo 新pid_max> /proc/sys/kernel/pid_max

    示例:echo 65536 > /proc/sys/kernel/pid_max

  5. 等待5分钟,检查该告警是否恢复。

    • 是,处理完毕。
    • 否,执行步骤 6。

检查系统环境是否异常。

  1. 联系操作系统维护人员,检查操作系统是否存在异常。

    • 是,恢复操作系统故障,执行步骤 7。
    • 否,执行步骤 8。

  2. 等待5分钟,检查该告警是否恢复。

    • 是,处理完毕。
    • 否,执行步骤 8。

收集故障信息。

  1. 在主集群的FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  2. 在“服务”下拉框中勾选“所有服务”,单击“确定”。
  3. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后30分钟,单击“下载”。
http://www.lryc.cn/news/220109.html

相关文章:

  • 软考 系统架构设计师系列知识点之数字孪生体(3)
  • 新闻稿的写作注意事项!纯干货
  • Android开发知识学习——从Retrofit原理来看HTTP
  • 计算机毕设 基于大数据的抖音短视频数据分析与可视化 - python 大数据 可视化
  • 1.OpenResty系列之入门简介
  • Trie树(字典树)
  • 华为政企网络安全产品集
  • 02-Sping事务实现之声明式事务基于XML的实现方式
  • 桶装水订水系统水厂送水小程序开发;
  • png或jpg等图片文件转ico图标文件,格式在线转换
  • 操作系统——对文件的 基本操作(王道视频p65)
  • 中海达守护电力人员作业安全
  • 想学计算机编程从什么学起?零基础如何自学计算机编程?中文编程开发语言工具箱之渐变标签组构件
  • 中国人民大学与加拿大女王大学金融硕士——一把开启未来金融世界的金钥匙
  • MVC、MVP、MVVM区别
  • 【Kotlin精简】第7章 泛型
  • ElasticSearch与Lucene是什么关系?Lucene又是什么?
  • 【算法练习Day40】打家劫舍打家劫舍 II打家劫舍 III
  • 双十一运动健身好物推荐,这几款健身好物一定不要错过!
  • Angular异步数据流编程
  • 古典舞学习的独舞与群舞,古典舞的成品舞蹈教学大全
  • 听GPT 讲Rust源代码--library/std(16)
  • 计算机编程软件编程基础知识,中文编程工具下载分享
  • 微信小程序里怎么添加砍价活动
  • 如何在Python爬虫中使用IP代理以避免反爬虫机制
  • 干货丨Linux终端常见用法总结(收藏)
  • 【RealTek sdk-3.4.14b】RTL8197FH-VG+RTL8812FR实现实现Host 网络和Guest 网络隔离以及各个连接终端间隔离功能
  • 【漏洞复现】Metinfo6.0.0任意文件读取漏洞复现
  • 3.22每日一题(二重积分求平面区域面积)
  • Hadoop环境搭建