当前位置: 首页 > news >正文

linux性能分析(七)CPU性能篇(二)怎么理解平均负载

一    怎么理解平均负载

①  如何查看平均复杂

查看'系统负载'的命令: top、'uptime'、w、'cat /proc/loadavg'、tload

/proc/loadavg 

  

思考: uptime'每列'输出的'含义'?重点: '当前时间'、'系统运行时间'、'正在登录用户数'、'平均负载'

思考:如何'观测'和'理解'这个最'常见'、也是'最重要'的'平均负载'系统指标?

思考: 'man uptime' 理解平均负载

知识点: '可运行'状态和'不可中断'状态进程的理解

linux 进程的六种状态 

引入: '不可中断案例'讲解备注: 不可中断状态实际上是'系统'对'进程和硬件设备'的一种'保护'机制

思考: 如何'更通俗'的理解'负载均衡'?1、平均负载其实就是'平均活跃进程数'2、直观上的理解就是'单位时间内的活跃进程数'3、但它实际上是'活跃进程数'的'指数衰减'平均值

思考: '平均负载'和'cpu个数'关系?绑核: 对于'特定进程或线程'需要绑定到'指定的核'上运行

③  平均负载多少合理

有了'CPU 个数'.我们就可以判断出: 当平均负载比 CPU 个数还'大'的时候,系统已经出现了'过载'

思考: 平均负载有'三'个数值,到底该参考'哪一个'呢?核心: 分析系统负载的'趋势'

思考: 在'实际生产环境'中,平均负载'多高'时,需要我们'重点关注'呢?

④  平均负载CPU使用率关系

CPU密集型和I/O密集型区别

说明:云服务器涉及这'两种机型',CPU、内存、硬盘性能和容量不同.

⑤  案例背景

1、我们以'三个示例'分别来看这'三种'情况2、并用 'iostat、mpstat、pidstat' 等'工具',找出平均负载升高的'根源'遗留: 后续会'开一个专题'讲解iostat、mpstat、pidstat的'综合'使用,这里暂时'局限'某一特性测试'环境': 16 CPU、32GB 内存运行'用户': 以 'root' 用户运行

stress    stress各种测试

强调: 一定要'深入'了解 stress的各种参数含义,这样'压侧'的时候才能结合现象'判断'是否符合预期

⑥  模拟'CPU密集型进程

场景'一': stress '模拟' CPU '密集型' 进程1、第一个'终端'运行 'stress' 命令,模拟一个 CPU 使用率 '100%' 的场景目的: stress '测试cpu' 主要是在'用户态'将cpu'耗尽'

2、接着在'第二个终端'运行 uptime 查看平均负载的变化情况:watch -n1 -d uptime-d 参数表示'高亮'显示'变化'的区域

3、最后在'第三个终端'运行 mpstat 查看 CPU 使用率的'变化'情况:mpstat -P ALL 5-P ALL 表示'监控所有CPU',后面数字5表示'间隔5秒后'输出一组数据

现象:正好有一个 CPU 的'使用率'为 100%,但它的 'iowait' 只有 '0'.结论:说明'平均负载的升高'正是由于 'CPU使用率为 100%' 导致.

  

思考: 到底是'哪个进程'导致了 CPU 使用率为 '100%' 呢?可以使用 'pidstat' 来查询:pidstat -u 5 1备注: -u表示'CPU指标',间隔'5秒后'输出一组数据

pidstat命令详解

⑦  模拟 I/O 密集型进程

友情提示: 做'下一个'实验之前把'上一个'实验复原1、首先还是运行 'stress' 命令,但这次'模拟 I/O' 压力,即不停地执行 'sync':stress -i 1 --timeout 600补充: stress -i 1 --hdd 1 --timeout 600 可以实现'IO负载'的效果

2、在'第二个'终端运行 uptime 查看'平均负载'的'变化'情况:watch -n 1-d uptime

3、然后'第三个'终端运行 'mpstat' 查看 'CPU 使用率'的变化情况:显示'所有CPU'的指标,并在'间隔5秒'输出一组数据mpstat -P ALL 5 1现象:1、其中'一个 CPU' 的系统 'CPU 使用率'升高到了 '63.39%'2、而 iowait 高达 '21.47%'结论: 这说明'平均负载的升高'是由于 'iowait 的升高'

4、思考:到底是'哪个进程'导致 iowait 这么'高'呢?# 间隔5秒后输出一组数据,-u表示CPU指标pidstat -u 5 1  '或'  iotop 观察结论: 平均负载的升高是由于 'iowait 的升高',还是由于 'stress 进程'导致的

iowait 过高问题的查找及解决linux

⑧  模拟大量进程的场景

铺垫: 当系统中'运行进程'超出 'CPU 运行能力'时,就会出现'等待 CPU' 的进程即: 进程 '等待cpu 调度'的场景1、这里我们'还是'使用 stress,但这次模拟的是 '64' 个进程:stress -c 64 --timeout 600

说明: 1)、由于系统有 '16 个CPU',明显比 '64个进程' 要'少'得多2)、因而系统的 CPU 处于'严重过载'状态,平均负载高达'57.89'

2、接着再运行 'pidstat' 来看一下'进程的情况':间隔'5秒后'输出'一组'数据: pidstat -u 5 1

源码安装升级sysstat包     1.11.5 sysstat包下载地址

结论:1、可以看出'64 个进程'在争抢 '16' 个 CPU机制: 某一时刻只能某一个'进程'占用'CPU',这里相当于 '4' 个进程在争抢 '1' 个 CPU2、每个进程'等待 CPU' 的时间 '也就是代码块中的 %wait 列' 高达 75%3、这些'超出' CPU 计算能力的进程,最终导致 'CPU 过载'遗留: 等待cpu进程为什么也'导致CPU利用率高'呢?

⑨  平均负载小结

⑩  补充

/proc/loadavg 平均负载

思考: 遇到客户反馈'慢'的情况,这个时候我们'怎么分析'呢?

说明: 刻意使用'htop'更清晰的查看'负载'

说明: 恰当的'比喻'

思考: 如何观察'线程级别'的工具

思考: ls命令为什么'无法'使用?

思考: '超载'如何计算?

http://www.lryc.cn/news/205767.html

相关文章:

  • PostgreSQL12中浮点数输出算法优化带来的小问题
  • Hive安装配置笔记
  • 前端数据可视化之【Echarts下载使用】
  • 本机计算机上的mysql启动后停止
  • Java中ReentrantLock测试线程的安全
  • Vue-dvadmin-d2-crud-plus-常用配置-row-handle-columns-options
  • 【OpenCV实现图像的算数运算,性能测试和优化,改变颜色空间】
  • 多级缓存入门
  • CentOS卸载LVM磁盘的方法
  • ChatGPT:Spring Boot和Maven——Java应用开发的关键工具和区别
  • 智能振弦传感器:参数智能识别技术的重要科技创新
  • tooltip实现悬停内容染色
  • “深入探讨Java JUC中的ReentrantLock锁:实现多线程同步与并发控制“
  • Java|学习|多线程
  • 【Python机器学习】零基础掌握VotingClassifier集成学习
  • 深入了解JavaScript中的AJAX和HTTP请求
  • 第87步 时间序列建模实战:LSTM回归建模
  • GB/T28181协议介绍
  • 光致发光荧光量子检测的作用
  • 深度学习第四课
  • Linux创建临时文件mkstemp()tmpfile()
  • js的节流和防抖详解
  • 基于SpringBoot的水果销售网站
  • vue2进阶学习知识汇总
  • SQL SERVER连接oracle数据库几种方法
  • 存储优化知识复习三详细版解析
  • HotReload for unity支持的代码修改
  • 写一个呼吸灯要几行代码?
  • Banana Pi BPI-W3(Armsom W3)RK3588开当板之调试UART
  • LeetCode88——合并两个有序数组