当前位置: 首页 > news >正文

八、K8S之HPA自动扩缩容

HPA

一、概念

HPA(Horizontal Pod Autoscaler,水平 Pod 自动伸缩)是 Kubernetes 中的一种特性,其作用是根据资源使用情况自动调整 Pod 的副本数,以实现应用程序的自动扩展和收缩。

HPA 可以根据 CPU 使用率或其他自定义指标来自动扩展或收缩 Pod。每隔30s(可以通过–horizontal-pod-autoscaler-sync-period修改)查询metrics的资源使用情况,Pod 的 CPU 使用率超过了 HPA 的目标值,那么 HPA 将创建更多的 Pod 来处理更多的工作负载。反之,如果 CPU 使用率降低,那么 HPA 将删除一些 Pod 以减少资源消耗。这使得集群可以根据负载需求动态扩展或收缩应用程序。

HPA 常用于处理负载波动的应用程序,例如 Web 服务器、API 服务等。通过设置合适的 HPA 目标值和最小/最大 Pod 数量,可以确保集群始终保持在正确的资源使用级别,从而避免资源浪费和服务中断。通常用于 Deployment,不适用于无法扩/缩容的对象,如 DaemonSet

在创建 HPA 时,您需要指定以下参数:

  • 目标资源:每个 Pod 根据 HPA 所监视的资源管理器对象进行计算。
  • 目标平均使用率:这是指将资源用量(如 CPU 或内存)与每个 Pod 的请求资源量相对比。HPA 根据此指标确定要在群集中启动的 Pod 的数量。
  • 最小 Pod 数量和最大 Pod 数量:根据当前的负载情况,HPA 将自动扩展或收缩 Pod 的数量,但是不能超出设置的最小和最大 Pod 数量。

通过 HPA 功能,Kubernetes 可以轻松地管理和调整应用程序的资源使用,提高了应用程序的可用性和容错性,在高负载时提供更好的响应能力,并减少了内存和 CPU 等资源的浪费。

二、使用

  • 创建
kubectl  autoscale deploy nginx-deploy --cpu-percent=20 --min=2 --max=5
  • 获取 HPA 信息
kubectl get hpa 

三、测试脚本

while true; do wget -q -O- http://192.168.31.100:30906 > /dev/null ; done
http://www.lryc.cn/news/196892.html

相关文章:

  • 损失函数总结(二):L1Loss、MSELoss
  • 力扣(LeetCode)2530. 执行 K 次操作后的最大分数(C++)
  • C# 快速简单反射操作
  • 【python高级】设计模式、类工厂、对象工厂
  • Flink的算子列表状态的使用
  • 使用 Github Actions 工作流自动部署 Github Pages
  • Xposed hook 抖音账户信息
  • 回顾 | E³CI效能认知与改进论坛,助力企业研发效能度量和提升
  • 科技的成就(五十二)
  • 【23种设计模式】装饰器模式
  • 解决IDEA中SpringBoot项目创建多个子模块时配置文件小绿叶图标异常问题
  • 【马蹄集】—— 概率论专题
  • Spring 6整合单元测试JUnit4和JUnit5
  • 【好书推荐】深入理解现代JavaScript
  • 高效协同: 打造分布式系统的三种模式
  • 机器学习-无监督学习之聚类
  • 智能垃圾桶丨悦享便捷生活
  • 【数据结构】线性表(一)线性表的定义及其基本操作(顺序表插入、删除、查找、修改)
  • MyBatis的自定义插件
  • 生物制剂\化工\化妆品等质检损耗、制造误差处理作业流程图(ODOO15/16)
  • vbv介绍
  • Linux CentOS 8(网卡的配置与管理)
  • python -m pip install 和 pip install 的区别解析
  • 深度解读js中数组的findIndex方法
  • ICML2021 | RSD: 一种基于几何距离的可迁移回归表征学习方法
  • 中国人民大学与加拿大女王大学金融硕士:在该奋斗的岁月里,对得起每一寸光阴
  • Python基础教程:装饰器的详细教程
  • Apache poi xwpf word转PDF中文显示问题解决
  • Gartner发布2024年十大战略技术趋势
  • 在UniApp中使用uni.makePhoneCall方法调起电话拨打功能