当前位置: 首页 > news >正文

服务器假死日志按时间统计排查

文章目录

    • 场景
    • 解决方案
    • 排查过程
      • 根据cost时间来筛选

场景

服务器假死,进程还在,但是已经接不到请求了。因此有客户报事,发现服务假死了。

解决方案

这种假死问题一般不太好排查,常规来说有几种可能。
1、慢sql导致卡死。
2、大数据列表等导致内存占慢。
3、gc的回收问题。

操作步骤:
1、首先要把gc日志备份,这一步一定要先做,因为常规的gc文件重启后就会覆盖,就找不到了。
2、然后才是重启。
3、后续的排查。

排查过程

首先是gc.out,很不幸忘了备份了,因为好久不遇到,忘了要先备份gc日志再重启。

那么没办法,从日志找吧。
服务假死,日志输出会明显减少,甚至不输出。 这个彻底死掉的时间很好判断,很长时间没日志,最后一条就是彻底死掉的时间。

但是如何排查何时开始变慢的呢?
有种思路就是根据分钟统计日志行数,正常来说基本会差不太多,如果某个时间日志条数明显减少,就说明开始有问题了。

命令:

例如日志为:
2023-09-22 11:26:47,266 [http-nio-8081-exec-244] - INFO  com.ttt.common.aop.ServiceDigestAop$$EnhancerBySpringCGLIB$$42f78b6 -
实际上我们截取到分钟就行了。awk '{print $1FS$2}' business.log |cut -c 1-16 |sort | uniq -c $12023-09-22FS是分隔符,默认是空格,加这个主要是可以区分日 和 时分$211:26:47cut -c 1-16 截取1-16个字符,正好到分钟如果要根据数量倒序排序,可以加个 sort -nr
awk '{print $1FS$2}' business.log |cut -c 1-16 |sort | uniq -c | sort -nr

获取到的数据如:

4048 2023-09-22 11:28
2503 2023-09-22 11:29
3891 2023-09-22 11:30
4902 2023-09-22 11:31700  2023-09-22 11:32300 2023-09-22 11:331 2023-09-22 11:34

很明显,700对应的时间就开始有问题了。

然后就可以把这30分钟的数据全拿出来。

 grep "2023-09-22 11:30" business.log > /tmp/11点30.txt 输处到/tmp目录,可以不受服务器账户权限限制,例如下载等

根据cost时间来筛选

还有一种思路,是根据cost时间来筛选,项目中一般都做了log日志拦截器,会打印耗费的时间,例如:

日志未:
2023-09-22 11:30:28,526 [http-nio-8081-exec-305] - INFO  com.www.common.aop.ServiceDigestAop - *** cost 77945 msgrep "cost*ms" business > /tmp/cost-12点所有的.txt

这样导出的日志都是带时间的,找到比较大的,再根据线程号去看具体某条请求。

http://www.lryc.cn/news/173538.html

相关文章:

  • CSS——grid网格布局的基本使用
  • 【python】使用Nuitka打包python项目-demo示例
  • Java多线程篇(5)——cas和atomic原子类
  • 数据结构---栈和队列
  • 2023-9-23 合并果子
  • 基于QT和UDP实现一个实时RTP数据包的接收,并将数据包转化成文件
  • 云原生安全性:保护现代应用免受威胁
  • R语言绘图-3-Circular-barplot图
  • 解决Keil5下载没有对应芯片Flash的问题
  • 深拷贝与浅拷贝(对象的引用)
  • 重新认识架构—不只是软件设计
  • 我的创业笔记:困境与思索
  • minio文件上传
  • IDEA .iml文件及.idea文件夹详解
  • 使用Python做一个微信机器人
  • 云计算战略:选择适合你业务的云平台
  • Python:打印目录下每层的文件总数
  • LVS-NAT模式
  • 【神印王座】龙皓晨竟然上了头版头条!内容违背,新闻真实性原则
  • C++之类和函数权限访问总结(二百二十七)
  • 手动部署 OceanBase 集群
  • 【操作系统笔记十二】Linux常用基础命令
  • Compose LazyColumn 对比 RecyclerView ,谁的性能更好?
  • [python 刷题] 49 Group Anagrams
  • vue+element plus 使用table组件,清空用户的选择项
  • 改写软件-怎么选择改写软件
  • gateway之跨域处理
  • uniapp 实现不同用户展示不同的tabbar(底部导航栏)
  • 线性归一化是什么,用python实现数据的线性归一化
  • 超级好用绘图工具(Draw.io+Github)