当前位置: 首页 > news >正文

大数据-之LibrA数据库系统告警处理(ALM-37014 Gaussdb进程锁文件已经存在)

告警解释

当集群中的CN实例或者DN实例锁文件创建失败时,产生该告警。

告警属性

告警ID

告警级别

可自动清除

37014

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称

RoleName

产生告警的角色名称

HostName

产生告警的主机名

Instance

产生告警的实例

对系统的影响

发生数据库锁文件创建失败时,锁文件创建失败的实例可能无法启动,集群将无法正常启动。

可能原因

系统数据实例异常终止,导致系统中存在锁文件残留。

处理步骤
  1. 使用omm用户登录告警上报的节点。
  2. 初始化环境变量。

    source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile

  1. 执行如下命令获取出现告警的主机和数据实例的数据目录。(如下主机为10.252.153.218,数据目录为/srv/BigData/mppdb/data1/coordinator)
     
  2. 使用SSH方式登录上述主机,执行如下命令进入目录并检查是否存在postmaster.pid文件。
     
    • 是,执行5。
    • 否,执行8。
  3. 执行如下命令获取postmaster.pid文件中第一行的pid。
     
  4. 执行如下命令查看上述pid对应的进程是否存在。
    ps -ef |grep 42883
    omm       42883      1  4 Nov05 ?        17:25:59 /opt/huawei/Bigdata/mppdb/core/bin/gaussdb --coordinator -D /srv/BigData/mppdb/data1/coordinator
    omm      125791  55322  0 15:10 pts/0    00:00:00 grep --color=auto 42883
    • 是,执行7。
    • 否,执行8。
  5. 执行如下命令终止上述进程,并删除postmaster.pid文件后查看告警是否恢复。
     
    • 是,处理完毕。
    • 否,执行8。
  6. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  7. 在“服务”下拉框中勾选“MPPDB”,单击“确定”。
  8. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。
http://www.lryc.cn/news/248002.html

相关文章:

  • STM32 基础知识
  • JVM——产生内存溢出原因
  • 关于X86机器上运行GnuCobol的研究
  • open与openat的区别
  • 人工智能与供应链行业融合:预测算法的通用化与实战化
  • Cytoscape学习教程
  • computed和watch相关
  • 反思一次效能提升
  • ElasticSearch之cat indices API
  • Composer update 跳过指定依赖
  • @RequestMapping详解:请求映射规则
  • C#中密封类和密封方法
  • Pytorch中的Net.train()和 Net.eval()函数讲解
  • 氪了几百亿,字节游戏停止了“跳动”
  • 进入docker容器
  • C陷阱与缺陷——第5章库函数
  • 【C++上层应用】6. 信号 / 中断
  • 树与二叉树堆:堆的意义
  • 什么时候适合做ui自动化测试?什么时候做接口自动化测试
  • [ABC261E] Many Operations(dp,位运算,打表)
  • 一、爬虫-爬取豆瓣电影案例
  • 4G5G防爆执法记录仪、防爆智能安全帽赋能智慧燃气,可视化巡检巡线,安全生产管控
  • 武汉数字孪生赋能工业制造,加速推进制造业数字化转型
  • 安卓密码框、EditText
  • ROS命令行工具
  • 深入浅出 Golang 中的直接依赖和间接依赖管理
  • 深入Python元编程:了解声明与初始化定制元类
  • [传智杯初赛] 期末考试成绩
  • Linux 常用基本命令
  • 阿里云语雀频繁崩溃,有什么文档管理工具是比较稳定的?