当前位置: 首页 > news >正文

设置K8s管理节点异常容忍时间

说明

每个节点上的 kubelet 需要定时向 apiserver 上报当前节点状态,如果两者间网络异常导致心跳终端,kube-controller-manager 中的 NodeController 会将该节点标记为 Unknown 或 Unhealthy,持续一段时间异常状态后 kube-controller-manager 会将该节点上的所有 pod 驱逐(1.24 版本后驱逐通过 taint toleration 实现)。

为了防止发生大面积 pod 驱逐,需要修改 kube-controller-manager 的以下参数:

● --pod-eviction-timeout duration The grace period for deleting pods on failed nodes. (default 5m0s)
● --node-monitor-grace-period duration Amount of time which we allow running Node to be unresponsive before marking it unhealthy. Must be N times more than kubelet’s nodeStatusUpdateFrequency, where N means number of retries allowed for kubelet to post node status. (default 40s)

修改方式

编辑所有管理节点的 /etc/kubernetes/manifests/kube-controller-manager.yaml 文件,在 spec.containers.command 增加如下命令行参数:

- --pod-eviction-timeout=180m
- --node-monitor-grace-period=180m

在这里插入图片描述
重启进程,或者移动配置文件,如果没有变化重启kubelet
在这里插入图片描述

http://www.lryc.cn/news/469226.html

相关文章:

  • 什么样的JSON编辑器才好用
  • ArkUI自定义TabBar组件
  • pair类型应用举例
  • 数字 图像处理算法的形式
  • 安徽对口高考Python试题选:输入一个正整数,然后输出该整数的3的幂数相加形式。
  • Node.js是什么? 能做什么?
  • JVM快速入门
  • 理解深度学习模型——高级音频特征表示的分层理解
  • 【HarmonyOS Next】原生沉浸式界面
  • 数据结构 ——— 树的概念及结构
  • 初探Vue前端框架
  • Lucas带你手撕机器学习——岭回归
  • C2W4.LAB.Word_Embedding.Part1
  • hive初体验
  • 云渲染主要是分布式(分机)渲染,如何使用blender云渲染呢?
  • WordPress与WP Engine:关键事件时间线
  • 大数据治理平台建设规划方案(71页WORD)
  • Maven 项目管理工具
  • ubuntu开机启动jar
  • 【目标检测02】非极大值抑制 NMS
  • 104协议调试工具
  • 日常记录:es TransportClient添加证书处理
  • apply call bind 简介
  • 数据结构 单调栈
  • 【NodeJS】NodeJS+mongoDB在线版开发简单RestfulAPI (七):MongoDB的设置
  • 基于flask和neo4j的医疗知识图谱展示问答系统
  • Python——脚本实现datax全量同步mysql到hive
  • Python爬虫教程:从入门到精通
  • pytorh学习笔记——cifar10(四)用VGG训练
  • CRLF、UTF-8这些编辑器右下角的选项的意思