当前位置：首页 > news >正文

【博客694】k8s kubelet 状态更新机制

news 2025/7/10 23:55:04

k8s kubelet 状态更新机制

场景：

当 Kubernetes 中 Node 节点出现状态异常的情况下，节点上的 Pod 会被重新调度到其他节点上去，但是有的时候我们会发现节点 Down 掉以后，Pod 并不会立即触发重新调度，这实际上就是和 Kubelet 的状态更新机制密切相关的，Kubernetes 提供了一些参数配置来触发重新调度的时间

kubelet 状态更新的基本流程：

1、kubelet 自身会定期更新状态到 apiserver，通过参数–node-status-update-frequency指定上报频率，默认是 10s 上报一次。
2、kube-controller-manager 会每隔–node-monitor-period时间去检查 kubelet 的状态，默认是 5s。
3、当 node 失联一段时间后，kubernetes 判定 node 为 notready 状态，这段时长通过–node-monitor-grace-period参数配置，默认 40s。
4、当 node 失联一段时间后，kubernetes 判定 node 为 unhealthy 状态，这段时长通过–node-startup-grace-period参数配置，默认 1m0s。
5、当 node 失联一段时间后，kubernetes 开始删除原 node 上的 pod，这段时长是通过–pod-eviction-timeout参数配置，默认 5m0s。

kube-controller-manager 和 kubelet 是异步工作的，这意味着延迟可能包括任何的网络延迟、apiserver 的延迟、etcd 延迟，一个节点上的负载引起的延迟等等。因此，如果–node-status-update-frequency设置为 5s，那么实际上 etcd 中的数据变化会需要 6-7s，甚至更长时间。

注意：

kubelet 在更新状态失败时，会进行nodeStatusUpdateRetry次重试，默认为 5 次。
kubelet 会在函数tryUpdateNodeStatus中尝试进行状态更新。Kubelet 使用了 Golang 中的http.Client()方法，但是没有指定超时时间，因此，如果 API Server 过载时，当建立 TCP 连接时可能会出现一些故障。
因此，在nodeStatusUpdateRetry * --node-status-update-frequency时间后才会更新一次节点状态。
同时，Kubernetes 的 controller manager 将尝试每–node-monitor-period时间周期内检查nodeStatusUpdateRetry次。在–node-monitor-grace-period之后，会认为节点 unhealthy，然后会在–pod-eviction-timeout后删除 Pod。
kube proxy 有一个 watcher API，一旦 Pod 被驱逐了，kube proxy 将会通知更新节点的 iptables 规则，将 Pod 从 Service 的 Endpoints 中移除，这样就不会访问到来自故障节点的 Pod 了。

如何配置：

对于这些参数的配置，需要根据不通的集群规模场景来进行配置。

社区默认的配置：

–node-status-update-frequency 10s
–node-monitor-period 5s
–node-monitor-grace-period 40s
–pod-eviction-timeout 5m

快速更新和快速响应：

–node-status-update-frequency 4s
–node-monitor-period 2s
–node-monitor-grace-period 20s
–pod-eviction-timeout 30s

在这种情况下，Pod 将在 50s 被驱逐，因为该节点在 20s 后被视为 Down 掉了，–pod-eviction-timeout在 30s 之后发生，但是，这种情况会给 etcd 产生很大的开销，因为每个节点都会尝试每 2s 更新一次状态。

如果环境有 1000 个节点，那么每分钟将有 15000 次节点更新操作，这可能需要大型 etcd 容器甚至是 etcd 的专用节点。

如果我们计算尝试次数，则除法将给出 5，但实际上每次尝试的 nodeStatusUpdateRetry 尝试将从 3 到 5。由于所有组件的延迟，尝试总次数将在 15 到 25 之间变化。

中等更新和平均响应：

–node-status-update-frequency 20s
–node-monitor-period 5s
–node-monitor-grace-period 2m
–pod-eviction-timeout 1m

这种场景下会 20s 更新一次 node 状态，controller manager 认为 node 状态不正常之前，会有 2m60/205=30 次的 node 状态更新，Node 状态为 down 之后 1m，就会触发驱逐操作。

如果有 1000 个节点，1 分钟之内就会有 60s/20s*1000=3000 次的节点状态更新操作。

低更新和慢响应：

–node-status-update-frequency 1m
–node-monitor-period 5s
–node-monitor-grace-period 5m
–pod-eviction-timeout 1m

Kubelet 将会 1m 更新一次节点的状态，在认为不健康之后会有 5m/1m*5=25 次重试更新的机会。Node 为不健康的时候，1m 之后 pod 开始被驱逐。

更多细节参考官方文档：

https://github.com/kubernetes-sigs/kubespray/blob/master/docs/kubernetes-reliability.md

http://www.lryc.cn/news/121055.html

相关文章：

【博客692】grafana如何解决step动态变化时可能出现range duration小于step

eNSP：ibgp的破水平切割练习

maven是什么？安装+配置

基于长短期神经网络LSTM的多分类代码

利用爬虫爬取图片并保存

设计模式之Bridge模式的C++实现

springboot异步任务

Flutter父宽度自适应子控件的宽度

什么是 API 安全？学习如何防止攻击和保护数据

简述 TCP 和 UDP 的区别以及优缺点和使用场景?

使用windows搭建WebDAV服务，并内网穿透公网访问【无公网IP】

科技感响应式管理系统后台登录页ui设计html模板

Lombok的使用及注解含义

实时通信应用的开发：Vue.js、Spring Boot 和 WebSocket 整合实践

【C++】C++异常

学生成绩管理系统V2.0

【C++】开源：tinyxml2解析库配置使用

如何使用webpack打包一个库library,使用webpack打包sdk.

项目一：基于stm32的阿里云智慧消防监控系统

【果树农药喷洒机器人】Part6：基于深度相机与分割掩膜的果树冠层体积探测方法

打印1到最大的n位数

设计模式行为型——状态模式

ElastAlert通过飞书机器人发送报警通知

恒温碗语音芯片，具备数码管驱动与温度传感算法，WT2003H-B012

新能源汽车需要检测哪些项目

VR内容定制 | VR内容中控管理平台可以带来哪些价值？

篇十八：状态模式：状态驱动的行为

【Tomcat】(Tomcat 下载Tomcat 启动Tomcat 简单部署基于Tomcat进行网站后端开发)

简单动态字符串 sds