当前位置: 首页 > news >正文

Jaeger的经典BUG原创

前端,笔者在使用Jaeger进行Trace监控的时候,当数据量增大到一定数量级时,出现了一次CPU暴增导致节点服务器挂了的经典案例,这里对案例进行一个简单的抽象,供大家参考:

首先通过pprof对耗时的函数进行定位:

发现是在Trace初始化的调用了HostIP方法特别耗时

然后看了下函数的实现:

找到了问题的疑似点:net.InterFaces

这个方式会调用底层的系统函数获取本机的IP,会打开一个socket,会不会因为大量打开socket,把CPU占满了呢?

做个实验:

把这个方法抽离出来,在服务器上做个高频调用!

日志如下:

cpu如下:

果然是它!确实在hostIP这里耗时

那看实锤了,就是因为每次数据上报都会一个协程来出来,协程中会新建一个jaeger trace来跟踪,jaeger每次都找一下本机IP,然后打开了很多的socket,然后机器CPU飙升,出现了Node的问题

那看看jaeger为啥会有这个问题

跟踪一下git上的提交记录:

啊,原来jaeger在某个版本已经修复了!把之前获取的IP放在内存里,下次就不再重复获取了!

难道有项目遇到了这个问题了?

看看commit

是在修复401问题,看下401问题是啥?

原来是另一个问题,这个HostIP其实有一个scoreAddr方法,当一个服务器有两个ip,比如内网ip和外网ip,按照这个方法的逻辑,会优先外网ip,但一个集群内,可能只有一个入口有外网ip,其他都是内网ip,这个时候入口机的ip和内网ip就适配了,jaeger信息也会异常,所以提出了这个问题,并进行修复

我们看看jaeger开发者这么说

原来开发者一直也是这个理念,而且在java的客户端已经实现了,但golang一直没有更新

额,原来大家都有拖延症!

搞定!

http://www.lryc.cn/news/148328.html

相关文章:

  • 四款简洁好看 自适应的APP下载单页源码
  • 【服务器】交换机带外管理和带内管理
  • Kotlin的内置函数 apply、let、run、with、also
  • 2023年人工景点行业研究报告
  • react轮播图
  • Openlayers 叠加天地图-中国近海海洋等深面图层服务
  • uniapp移动端h5设计稿还原
  • 后端数据配置相对路径,前端添加网站根 URL (根路径)- js获取网站项目根路径- 获取根路径后的第一个斜杠前 / 的项目- - 判断url包含某字符串
  • deepspeed多机多卡并行训练指南
  • 9.Redis-zset
  • 云计算的三个主要服务模型:IaaS、PaaS 和 SaaS
  • spring ioc,DI,AOP概述
  • meethigher-Apache Poi 实现Excel多级联动下拉框
  • 基于食肉植物算法优化的BP神经网络(预测应用) - 附代码
  • FFDNet-pytorch版本代码训练教程
  • C语言练习7(巩固提升)
  • golangORM框架Gorm
  • Python项目实战之《飞机大战游戏》
  • Mysql数据库(2)—事务和锁
  • Shell - 加固系统配置
  • 【linux】记录archlinux软件包更新后lualatex无法编译的一种解决方案
  • 设计模式中的关系
  • C语言之数组题
  • DbContext是Entity Framework中的一个核心类
  • BTC价格预测:灰度突如其来的胜利是否会打破“九月魔咒”?
  • 软件测试/测试开发丨Selenium 高级控件交互方法
  • 算法通关村-----二分查找在二叉搜索树中的应用
  • 总结限流、降级与熔断的区别
  • windows下安装go环境 和vscode中go扩展+调试
  • 销毁 ECharts 图表