当前位置: 首页 > news >正文

k8s集群异常恢复

前提、我自己的k8s采用的是单master节点+两个从节点部署,我针对单master情况进行恢复说明

场景一:正常开关虚拟机,可直接重启kubelet进行恢复

1、1、一般重启后三个节点都需要检查,输入命令检查kubelet:

systemctl status kubelet

在这里插入图片描述
2、状态不正常,输入命令启动kubelet:

systemctl restart kubelet

3、正常情况下,启动kubelet后,节点一般都会正常,除非etcd异常

4、输入查看命令:kubectl get pod -A,如果不能正常回显则说明异常

5、再次尝试手动恢复(虚拟机正常开关机情况下,重启能解决95以上的异常问题,如果不能正常,再重启一次),重启kubelet,输入命令:

systemctl restart kubelet

场景二:一般服务器直接断电或者异常,都很大机率造成etcd异常。所以一般都需要提前对etcd文件备份才行,备份命令

mkdir -p  /root/etcd/backup
#不知道路径可以查找etcd数据目录
find / -type d -name member
cd /root/etcd/backup
rm -rf *
echo "备份etcd"
cp -R -c /var/lib/etcd/member/* ./

恢复命令:

cd /var/lib/etcd/member
rm -rf *
cp -R -c /root/etcd/backup/* ./
systemctl restart kubelet
systemctl status kubelet
#查看pod状态,等待几分钟
kubectl get pod -A

后续:定位etcd异常方法
可以用命令

netstat -anp | grep 2379

在这里插入图片描述

如果有回显该端口提供了服务,则说明正常
另外的方法就是查看kube-apiserver服务的docker日志,查看命令:

docker ps -a | grep kube-apiserver

命令执行后再查看其日志:

docker logs --tail 500 -f 容器id

如果回显存在2379端口连接不上,则说明etcd出问题了

http://www.lryc.cn/news/288115.html

相关文章:

  • NOC总线(2)
  • 2401llvm,clang的libtooling
  • 数据结构—基础知识(13):树的存储结构
  • 【Python爬虫入门到精通】小白也能看懂的知识要点与学习路线
  • 服务器数据恢复—EVA存储raid5硬盘离线的数据恢复案例
  • MAMBA论文疑被拒收,计算机科学顶会评审遭质疑
  • EHS管理系统为何需要物联网的加持?
  • 记事本(父页面与iframe子页面的联通,vue3+ts展示fbx模型,与tga贴图)
  • 【好书推荐-第五期】《互联网大厂推荐算法实战》(异步图书出品)
  • C++ Qt day2
  • Mac上如何设置映射某个网站站点域名的IP
  • 智能分析网关V4智慧冶金工厂视频智能监管方案
  • WebSocket实现HTML+SpringBoot聊天功能,小程序+SpringBoot聊天功能
  • SpringMVC-RESTFul
  • Spring Boot3整合knife4j(swagger3)
  • 解决Windows系统本地端口被占用
  • GPS位置虚拟软件 AnyGo mac激活版
  • 视频号视频怎么使用视频号下载助手提取视频呢?
  • 第一篇【传奇开心果短博文系列】鸿蒙开发技术点案例示例:从helloworld开始理解鸿蒙开发ArkTS编程思路
  • 四、MySQL之DML DQL
  • YOLOv8优化策略:注意力涨点系列篇 | 多尺度双视觉Dualattention | Dual-ViT,顶刊TPAMI 2023
  • 视频渲染靠cpu还是显卡 会声会影视频渲染的作用是什么
  • v-if 导致 elementui 表单校验失效问题解决
  • Linux本地部署SVN服务结合内网穿透实现远程访问
  • 短信平台(电信)
  • 11.STM32F4 输入捕获
  • opencv#30 线性滤波
  • 如何使用iPhone或iPad上的二维码共享Wi-Fi密码?这里有详细步骤
  • 在游戏里开公司!基于ERNIE SDK的多智能体游戏应用
  • 【SpringCloud Nacos】 微服务治理介绍及Nacos引入初体验