当前位置: 首页 > news >正文

postgresql运维问题解决:PG集群备节点状态异常告警处理

小亦平台会持续给大家科普一些运维过程中常见的问题解决案例,运维朋友们可以在厂家问题及解决方案专栏查看更多案例

问题概述:

  • 故障: pg数据库备节点状态异常
  • 现象: 一般为集群间心跳超时导致,现象为集群有fail-count失败数告警,备节点状态为stop或alone。

问题分析:

  • 直接原因: 集群间心跳超时。
  • 故障表现:
    • 集群有fail-count失败数告警。
    • 备节点状态为stop或alone。

解决方案:

1. 用root用户登录数据库集群任一节点;

2. 检查集群状态: cls_status;

3.一般情况下会有fail-count告警,可以尝试通过resource cleanup 恢复异常节点的集群状态:
pcs resource cleanup pgsql --node 节点名;

4. 如果异常节点集群状态未恢复,可能为集群主备发生切换,需要清理异常节点的锁文件,可  以尝试删除锁文件后再执行第3步的命令:
rm -f /var/lib/pgsql/tmp/PGSQL.lock
pcs resource cleanup pgsql --node 节点名;

5. 如果还是不成功,则可能是数据库的baseline发生变化,或主节点的wal日志文件以及归档,备节点启动时无法找到文件,可以查看数据库日志分析具体原因,
数据库日志目录:
pg10.5:/pgdb/pgdata/log
pg11.6:/pglog
则需要重构异常备节点:
rm -rf /pgdb/pgdata
cls_rebuild_slave

立即查看更多postgresql的相关内容

运维工作中遇到难题?立即提交工单。小亦平台工程师火速响应,助您快速修复故障!

http://www.lryc.cn/news/620853.html

相关文章:

  • CVPR 2025 | 北大团队SLAM3R:单目RGB长视频实时重建,精度效率双杀!
  • 小杰python高级(six day)——pandas库
  • 一篇文章读懂.Net的依赖注入
  • C#WPF实战出真汁00--项目介绍
  • 融合服务器助力下的电视信息发布直播点播系统革新
  • 【测试用例】软件测试用例编写规范
  • 第三集 测试用例
  • [Android] 二十四节气日历v1.0.3 - 弘扬传统文化,精致设计,无广告纯净体验!
  • 在 CentOS 7 中使用 systemd 创建自定义服务
  • Java 设计模式-装饰器模式
  • 线程P4 | 线程安全问题及解决方法
  • Linux信号产生
  • Linux下使用Samba 客户端访问 Samba 服务器的配置(Ubuntu Debian)
  • mysql 提示符及快捷执行
  • 从零开始搭建React+TypeScript+webpack开发环境——基于MobX的枚举数据缓存方案设计与实践
  • React 数据持久化:从 “刷新就丢“ 到 “永存不灭“ 的实现方案
  • WEBSTORM前端 —— 第4章:JavaScript —— 第3节:数据类型与类型转换
  • Streamlit实现Qwen对话机器人
  • Pytest自动化测试框架总结
  • 2025年机器视觉与信号处理国际会议(MVSP 2025)
  • springboot博客实战笔记02
  • 游戏行业DevOps实践:维塔士集团基于Atlassian工具与龙智服务构建全球化游戏开发协作平台
  • 阿里云RDS SQL Server实例之间数据库迁移方案
  • flstudio.exe安装教程|FL Studio怎么下载安装?超简单中文指南
  • K8S企业级应用与DaemonSet实战解析
  • 深入解析 HTTP 协议演进:从 1.0 到 3.0
  • 怎么判断晶振的好坏,有什么简单的办法
  • .NET 的 WebApi 项目必要可配置项都有哪些?
  • 【论文阅读-Part1】PIKE-RAG: sPecIalized KnowledgE and Rationale Augmented Generation
  • 机器学习算法篇(八)-------svm支持向量机