当前位置：首页 > news >正文

设置K8s管理节点异常容忍时间

news 2025/6/25 20:39:18

说明

每个节点上的 kubelet 需要定时向 apiserver 上报当前节点状态，如果两者间网络异常导致心跳终端，kube-controller-manager 中的 NodeController 会将该节点标记为 Unknown 或 Unhealthy，持续一段时间异常状态后 kube-controller-manager 会将该节点上的所有 pod 驱逐（1.24 版本后驱逐通过 taint toleration 实现）。

为了防止发生大面积 pod 驱逐，需要修改 kube-controller-manager 的以下参数：

● --pod-eviction-timeout duration The grace period for deleting pods on failed nodes. (default 5m0s)
● --node-monitor-grace-period duration Amount of time which we allow running Node to be unresponsive before marking it unhealthy. Must be N times more than kubelet’s nodeStatusUpdateFrequency, where N means number of retries allowed for kubelet to post node status. (default 40s)

修改方式

编辑所有管理节点的 /etc/kubernetes/manifests/kube-controller-manager.yaml 文件，在 spec.containers.command 增加如下命令行参数：

- --pod-eviction-timeout=180m
- --node-monitor-grace-period=180m

在这里插入图片描述
重启进程，或者移动配置文件，如果没有变化重启kubelet

查看全文

http://www.lryc.cn/news/469226.html

安徽对口高考Python试题选:输入一个正整数，然后输出该整数的3的幂数相加形式。

Node.js是什么? 能做什么?

JVM快速入门

理解深度学习模型——高级音频特征表示的分层理解

【HarmonyOS Next】原生沉浸式界面

数据结构 ——— 树的概念及结构

初探Vue前端框架

Lucas带你手撕机器学习——岭回归

C2W4.LAB.Word_Embedding.Part1

hive初体验

云渲染主要是分布式（分机）渲染，如何使用blender云渲染呢？

WordPress与WP Engine：关键事件时间线

大数据治理平台建设规划方案（71页WORD）

日常记录：es TransportClient添加证书处理

apply call bind 简介

数据结构单调栈

【NodeJS】NodeJS+mongoDB在线版开发简单RestfulAPI (七)：MongoDB的设置

基于flask和neo4j的医疗知识图谱展示问答系统

Python——脚本实现datax全量同步mysql到hive

Python爬虫教程：从入门到精通

pytorh学习笔记——cifar10（四）用VGG训练

CRLF、UTF-8这些编辑器右下角的选项的意思

说明

修改方式

相关文章：