当前位置: 首页 > news >正文

从uptime看linux平均负载

        从前遇到系统卡顿只会top。。top看不出来怎么搞呢?

        Linux系统提供了丰富的命令行工具,以帮助用户和系统管理员监控和分析系统性能。在这些工具中,uptime、mpstat和pidstat是非常有用的命令,它们可以帮助你理解系统的平均负载以及资源使用情况。

uptime命令

        uptime命令用于显示系统运行的时间、用户数量以及平均负载。平均负载是指在特定时间间隔内,系统处于运行状态和不可中断状态的平均进程数。这个数字给出了系统工作负载的一个概览。

使用uptime命令

root@gl:/home/gl# uptime08:58:38 up  4:17,  4 users,  load average: 0.97, 1.00, 0.86

        这里的08:58:38是当前时间,up 4:17 表示系统已经运行了4小时17分钟,4 users表示有4个用户登录系统,load average: 0.97, 1.00, 0.86分别表示过去1分钟、5分钟和15分钟的平均负载。

mpstat命令

        mpstat命令用于报告CPU的统计信息。它可以显示每个可用CPU的性能统计,帮助你分析CPU的使用情况。

使用mpstat命令

Linux 4.15.0-213-generic (gl)   01/16/2024      _x86_64_        (2 CPU)08:58:13 AM  CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle
08:58:14 AM  all    0.00    0.00    8.75   25.62    0.00    3.12    0.00    0.00    0.00   62.50
08:58:14 AM    0    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00  100.00
08:58:14 AM    1    0.00    0.00   23.33   68.33    0.00    8.33    0.00    0.00    0.00    0.00

        可以看出,系统中有两个cpu,1号cpu(%iowait)68%,说明存在大量的IO操作。


pidstat命令

        pidstat用于监控各个进程的资源使用情况,包括CPU、内存、磁盘I/O等。

使用pidstat命令

root@gl:/home/gl# pidstat -u 1
Linux 4.15.0-213-generic (gl)   01/16/2024      _x86_64_        (2 CPU)08:58:34 AM   UID       PID    %usr %system  %guest   %wait    %CPU   CPU  Command
08:58:35 AM     0       220    0.00    8.91    0.00    0.00    8.91     1  kworker/1:1H
08:58:35 AM     0     18799    0.00    8.91    0.00    8.91    8.91     1  stress

PID:进程ID。
%usr:用户态CPU时间百分比。
%system:内核态CPU时间百分比。
%guest:客户机操作系统占用的CPU时间百分比。
%wait:进程等待I/O操作完成所占用的CPU时间百分比。
%CPU:总的CPU使用率百分比。
CPU:进程所在的CPU编号。
Command:进程的命令名。

        从pidstat的结果可以看出名为stress的这个进程是触发iowait较高的罪魁祸首。

ps命令

root@gl:/home/gl# ps aux | grep stress
root     18798  0.0  0.0   3704  1372 pts/0    S+   08:57   0:00 stress -i 1 --timeout 600
root     18799 11.3  0.0   3704   108 pts/0    D+   08:57   0:38 stress -i 1 --timeout 600

        通过ps命令先拿到stress的pid,如上有两个。

strace命令

        依次用strace查看进程正在执行的系统调用,发现在不停的执行sync(刷新缓存到磁盘)操作,所以合理怀疑可能是stress进程中写完文件刷新时存在死循环。下一步就可以考虑对比log分析对应部分的代码了。

root@gl:/home/gl# strace -p 18799
strace: Process 18799 attached
sync()                                  = 0
sync()                                  = 0
sync()                                  = 0
sync()                                  = 0
sync()                                  = 0
...

分析平均负载

        通过uptime命令提供的平均负载信息,我们可以得到系统整体的负载情况。如果平均负载数值超过了CPU核心数,这可能意味着系统过载。

        使用mpstat,我们可以深入了解每个CPU核心的使用情况,从而判断是否有核心过载或者空闲。pidstat则提供了进程级别的资源使用情况,帮助我们找出是哪些进程导致了高负载。更近一步的,可以使用strace命令查看查看指定进程在进行哪些系统调用

        所以结合mpstat、pidstat、ps、strace这些工具,我们可以全面分析系统的性能瓶颈,并采取相应的优化措施,从此再也不用慌了~

http://www.lryc.cn/news/283427.html

相关文章:

  • 经典数据库练习题及答案
  • 架构篇06-复杂度来源:可扩展性
  • flowable流程结束触发监听器 flowable获取结束节点 flowable流程结束事件响应监听器
  • 【Python3】【力扣题】389. 找不同
  • 【从0上手cornerstone3D】如何加载nifti格式的文件
  • c# 学习笔记 - 异步编程
  • 设置了uni.chooseLocation,小程序中打不开
  • spring retry 配置及使用
  • uni-app的组件(二)
  • 项目开发中安全问题以及解决办法——客户传进来的数据不可信
  • 解决springboot启动报Failed to start bean ‘subProtocolWebSocketHandler‘;
  • 什么是技术架构?架构和框架之间的区别是什么?怎样去做好架构设计?(一)
  • 【多线程】认识Thread类及其常用方法
  • 多用户商业版 whisper 2.1在线搭建教程
  • HEXO搭建个人博客
  • Spring MVC学习之——RequestMapping注解
  • 鸿蒙原生应用/元服务开发-延迟任务开发实现(二)
  • 机器学习在什么场景下最常用-九五小庞
  • 利用IP应用场景API识别真实用户
  • Hugging Face怎么通过国内镜像去进行模型下载(hf-mirror.com)
  • POKT Network 开启周期性通缩,该计划将持续至 2025 年
  • LRU Cache
  • 软件测试面试题整理
  • C++三剑客之std::variant(二):深入剖析
  • 实验一 安装和使用Oracle数据库
  • 软件工程研究生后期总结
  • Java爬虫爬取图片壁纸
  • 红队打靶练习:HOLYNIX: V1
  • elasticsearch[二]-DSL查询语法:全文检索、精准查询(term/range)、地理坐标查询(矩阵、范围)、复合查询(相关性算法)、布尔查询
  • Microsoft Word 设置底纹