当前位置: 首页 > news >正文

RabbitMQ 双机系统偶尔丢失消息问题排查

实话说起来,这个问题,实际是一个非常低级的错误导致的,算不得什么高深的技术问题。但是在排查的过程中,却是费了好大的功夫,死了不少脑细胞。所以也值得记录一下,算作给大家提个醒,或许可以帮大家节省点时间。

情况是这样的,我们的一个项目,采用双机热备的模式部署了一套应用系统,这个应用系统和上层的业务系统之间通过RabbitMQ进行消息交互。上层业务系统发布业务数据,应用系统订阅业务数据并处理。由于是双机热备模式,所以程序上还做了处理,只有主机负责订阅业务数据,备机不会进行订阅。

在开发测试阶段发现,应用系统偶尔会出现收不到上层业务系统发布的业务数据的情况。经过检查,RabbitMQ的队列中没有消息堆积,这说明要么上层业务系统没有将消息放入队列中,要么订阅过程中发生了消息丢失。

根据上面的判断,第一反应是网络问题,于是对网络进行了检测,排除了网络质量的问题。然后怀疑是我们业务系统没有正确处理订阅消息导致的,于是又在主机上进行了网络抓包,发现确实没有收到该订阅的消息。 既然网络没有问题,又确实没有收到消息,所以进一步怀疑是上层系统的问题,结果上层系统排查了半天,确认消息确实发布到了队列中。

于是问题就来了,既然消息进入了队列,队列里消息也被消费了,但为啥业务系统收不到? 于是大家一顿头脑风暴,最后突然间想到,双机系统出了问题? 该被主机处理的消息,被备机订阅到了?导致主机消息丢失?

按照这个思路一查,发现确实是这样的。原本不应该订阅和消息消息的备机居然收到了消息。根据设计这不应该发生。仔细一查,原来是程序出了BUG.

最后总结下来,虽然是一个低级的程序bug,但是排查过程中,浪费了太多的时间,主要是大家都没有考虑到双机系统会出现备机消费消息的可能性。 这个问题以后在双机或者多机系统中,应该最为一个排查项来考虑,以免走弯路。

http://www.lryc.cn/news/426248.html

相关文章:

  • Python 环境搭建指南 超详细
  • 使用三菱PLC源码进行PLC读取写入操作
  • 使用Nvm切换nodeJs高版本之后,使用npm install一闪而过
  • 【Kubernetes】k8s集群安全机制
  • 嵌入式学习---DAY24:进程--二
  • Diffusion Model相关论文解析之(二)DENOISING DIFFUSION IMPLICIT MODELS
  • 【STM32嵌入式系统设计与开发拓展】——14_定时器之输入捕获
  • docker swarm如何让两个副本分别跑在两台不同的主机上
  • GPT助手的训练流程四个主要阶段( GPT Assistant training pipeline )
  • 网络如何发送一个数据包
  • 【Harmony OS 4.0】向上滑动加载案例
  • SQL基础教程(八)SQL高级处理
  • [论文笔记] Data-Juicer: A One-Stop Data Processing System for Large Language Models
  • 期末速成复习资料——操作系统
  • Android之Service与IntentService区别
  • 【MySQL】表的设计
  • NC 用两个栈实现队列
  • 用后端实现一个简单的登录模块2 前端页面
  • MySQL慢查询的查找语法
  • SQL中的聚合方法与Pandas的对应关系
  • 计算机毕业设计选题推荐-计算中心高性能集群共享平台-Java/Python项目实战
  • 仿RabbitMq实现简易消息队列基础篇(future操作实现异步线程池)
  • 经典算法题总结:数组常用技巧(双指针,二分查找和位运算)篇
  • 版本控制基础理论
  • 微分方程(Blanchard Differential Equations 4th)中文版Section1.4
  • 求职Leetcode算法题(7)
  • ActiveMQ、RabbitMQ、Kafka、RocketMQ在事务性消息、性能、高可用和容错、定时消息、负载均衡、刷盘策略的区别
  • HanLP分词的使用与注意事项
  • Python 的进程、线程、协程的区别和联系是什么?
  • 实时数据推送:Spring Boot 中两种 SSE 实战方案