当前位置: 首页 > news >正文

k8s笔记24--安装metrics-server及错误处理

k8s笔记24--安装metrics-server及错误处理

  • 1 介绍
  • 2 安装
  • 3 常见错误
    • 第一次错误 持续 Failed probe
    • 第二次错误 bad status code "403 Forbidden"
  • 4 说明

1 介绍

最近一个同事在老版本的 k8s 上安装metrics-server,pod一直处于running 非就绪状态,经过查看发现存在 tls 、软件版本、 资源权限等问题。记录在此处,以便于后续查阅、同类问题续更。

2 安装

参考官方文档 kubernetes-sigs/metrics-server 执行如下命令即可

kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml

注意事项:

  1. 如果需要忽略 Kubelet certificate ,name只需要在 deployment 的containers.args 中加上 –kubelet-insecure-tls 即可
  2. 如果在国内,需要将镜像仓库更改为国内的源,例如阿里云的,例如将 8s.gcr.io/metrics-server/metrics-server 更改为 registry.aliyuncs.com/google_containers/metrics-server
  3. 需要关注k8s 和 metrics-server 版本对应关系,高版本的server可能不兼容低版本的k8s集群
  4. 需要确认最新 components.yaml 中授权是不是满足需求

3 常见错误

笔者最近在 k8s 1.18.0 版本上安装 metrics-server, 先后报了两种错,具体如下:

第一次错误 持续 Failed probe

持续报错如下,检查参数发现都正常,最后发现1.18.0 和 metrics-server 6.x.x 不匹配 ,将其更改为 0.5.0 后报错发生改变了
Compatibility Matrix

Metrics ServerMetrics API group/versionSupported Kubernetes version
0.6.xmetrics.k8s.io/v1beta11.19+
0.5.xmetrics.k8s.io/v1beta1*1.8+
0.4.xmetrics.k8s.io/v1beta1*1.8+
0.3.xmetrics.k8s.io/v1beta11.18-1.21+
I0209 06:41:27.899879       1 server.go:187] "Failed probe" probe="metric-storage-ready" err="no metrics to serve"
I0209 06:41:37.899853       1 server.go:187] "Failed probe" probe="metric-storage-ready" err="no metrics to serve"

第二次错误 bad status code “403 Forbidden”

将版本更改为0.5.0 后持续报错403错误,根据提示 /stats/summary 发现可能是权限不够,检查发现最新的 components.yaml (截止2023-02-09) 中ClusterRole中只有nodes/metrics权限,缺少 nodes/stats 权限,因此手动添加权限后重新部署就恢复正常。

I0209 06:54:30.425470       1 server.go:188] "Failed probe" probe="metric-storage-ready" err="not metrics to serve"
E0209 06:54:34.737196       1 scraper.go:139] "Failed to scrape node" err="GET \"https://172.22.0.139:10250/stats/summary?only_cpu_and_memory=true\": bad status code \"403 Forbidden\"" node="cnshc-map-p01012"
E0209 06:54:34.743811       1 scraper.go:139] "Failed to scrape node" err="GET \"https://172.22.0.67:10250/stats/summary?only_cpu_and_memory=true\": bad status code \"403 Forbidden\"" node="cnshc-map-p01041"
I0209 06:54:40.425528       1 server.go:188] "Failed probe" probe="metric-storage-ready" err="not metrics to serve"
E0209 06:54:49.734943       1 scraper.go:139] "Failed to scrape node" err="GET \"https://172.22.0.67:10250/stats/summary?only_cpu_and_memory=true\": bad status code \"403 Forbidden\"" node="cnshc-map-p01041"
E0209 06:54:49.749762       1 scraper.go:139] "Failed to scrape node" err="GET \"https://172.22.0.139:10250/stats/summary?only_cpu_and_memory=true\": bad status code \"403 Forbidden\"" node="cnshc-map-p01012"
I0209 06:54:50.425584       1 server.go:188] "Failed probe" probe="metric-storage-ready" err="not metrics to serve"

4 说明

软件:
k8s 版本: 1.18.0
参考文档:
metrics-server/blob/master/KNOWN_ISSUES.md
github metcis-server
unable to fetch metrics from node c2: request failed - “403 Forbidden”
Metrics servers deployment fails “no metrics to serve”

http://www.lryc.cn/news/527.html

相关文章:

  • 【电商】订单系统--售后的简易流程与系统关系
  • 低代码开发平台|生产管理-成本核算搭建指南
  • Xshell 安装及使用方法
  • 【Axure教程】转盘抽奖原型模板
  • 量子比特大突破!原子薄材料成为“救世主”
  • Swagger3 API接口文档规范课程(内含教学视频+源代码)
  • 数据库的基本操作
  • 分享5个超好用的Vue.js库
  • 第四章.误差反向传播法—ReLU/Sigmoid/Affine/Softmax-with-Loss层的实现
  • Python-第二天 Python基础语法
  • 命令模式包含哪些主要角色?怎样实现命令?
  • SpringCloud-Feign
  • XCP实战系列介绍08-基于Vehicle Spy进行XCP测量的工程配置详解
  • JVM调优几款好用的内存分析工具
  • Vue中路由缓存及activated与deactivated的详解
  • 【漏洞复现】phpStudy 小皮 Windows面板 RCE漏洞
  • 跨域小样本系列2:常用数据集与任务设定详解
  • HTML浪漫动态表白代码+音乐(附源码)
  • The last packet sent successfully to the server was 0 milliseconds ago. 解决办法
  • 分布式高级篇1 —— 全文检索
  • 集成电路开发及应用-模拟数字部分专栏目录
  • ios使用SARUnArchiveANY 解压rar文件(oc和swift版本)
  • 【Python学习笔记】21.Python3 函数(2)
  • day57回文子串_最长回文子序列
  • Element UI框架学习篇(二)
  • 【C++】类与对象(上)
  • Leetcode.1797 设计一个验证系统
  • Kaldi - 数据文件准备
  • 91.【SpringBoot-03】
  • 【本地项目】上传到【GitLab】流程详解