K8S健康检查巡检清单
以下是一份基于Kubernetes生产实践的健康检查巡检清单,涵盖集群核心组件、节点、工作负载、存储、网络等关键维度,结合具体参数与阈值,供运维人员系统化执行。
一、集群核心组件巡检
检查项 | 检查命令/方法 | 参数与阈值 | 风险等级 |
API Server健康 | kubectl get componentstatuses | 所有组件状态为Healthy | 高(若异常则集群不可用) |
etcd集群状态 | etcdctl endpoint health | 所有成员返回health: true,无超时响应 | 高 |
Controller Manager | kubectl get pods |