当前位置: 首页 > news >正文

记录一次 k8s 节点内存不足的排查过程

背景:前端服务一直报404,查看k8s日志,没发现报错,但是发现pods多次重启。

排查过程:

  1. 查看pods日志,发现日志进不去。
kubectrl logs -f -n weave pod-name --tail 100
  1. 查看pod describe
kubectl describe po -n weave senseweave-capability-gateway-6c5485f7bf-xxxx
  • Exit Code 为 137:通常表示该容器被 Linux OOM(Out-of-Memory)杀手终止。这通常发生在 Pod 超过了内存限制,或者运行该 Pod 的节点内存不足时。
  • Restart Count 为2,表示最近pod重启了2次
  • 当前pods没有指定 limit 资源
    在这里插入图片描述
    原因分析:如果pod不指定 limit, 多个pod间会存在资源争抢,并且不指定资源的pod,在oom的时候,会优先被 Terminal 掉。
  1. 查看当前节点的内存使用情况
 kubectl top nodes --no-headers | sort -k4 -nr# 解释:#  --no-headers 不显示表头,#  sort -k4 -nr 按照第四列降序排序#    -n 按照数值排序#    -r 反向排序

23-8 节点的内存已经快满了。
在这里插入图片描述
pods 是通过 deployment 部署的,多个节点都有亲和性标签,但是 pod 还是部署到了 23-8 节点上。
分析原因可能是,不指定 limit 导致的

解决办法:

deployment 指定 limit 资源大小,重启 pods 。

http://www.lryc.cn/news/493402.html

相关文章:

  • 探索天空中的“名字”——用Landsat影像记录你的名字形状!
  • QT6学习第四天 感受QT的文件编译
  • 透视投影(Perspective projection)与等距圆柱投影(Equirectangular projection)
  • 5 Java字符串操作
  • 【C++习题】17.二分查找算法_二分查找
  • Spring Boot英语知识网站:架构与开发
  • Unity ShaderLab 实现网格爆炸
  • 2024/11/28学习日志
  • 在shardingsphere执行存储过程
  • 1.文件目录操作
  • Vue单页面应用和多页面应用
  • Lombok :简化 Java 编程的得力工具
  • AIGC引领金融大模型革命:未来已来
  • DBA面试题-1
  • 用go语言写一个小服务
  • 亚马逊开发视频人工智能模型,The Information 报道
  • WordCloud参数的用法:
  • qml调用c++类内函数的三种方法
  • NLP任务四大范式的进阶历程:从传统TF-IDF到Prompt-Tuning(提示词微调)
  • GAMES101:现代计算机图形学入门-笔记-09
  • 【Db First】.NET开源 ORM 框架 SqlSugar 系列
  • MySQL聚合查询分组查询联合查询
  • 告别照相馆!使用AI证件照工具HivisionIDPhotos打造在线证件照制作软件
  • 通信原理第三次实验
  • 【halcon】Metrology工具系列之 get_metrology_object_result_contour
  • A052-基于SpringBoot的酒店管理系统
  • NLP信息抽取大总结:三大任务(带Prompt模板)
  • python常见问题-pycharm无法导入三方库
  • 迅为RK3588开发板Android系统开发笔记-使用ADB工具
  • 什么是分布式数据库?