当前位置: 首页 > news >正文

Kubernetes相关生态

1、PrometheusMetrics ServerKubernetes监控体系

简介: Prometheus 项目与 Kubernetes 项目一样,也来自于 Google Borg 体系,它的原型系统,叫作 BorgMon,是一个几乎与 Borg 同时诞生的内部监控系统
Prometheus 项目的作用和工作方式,官方示意图
Prometheus 项目工作的核心,是使用 Pull (抓取)的方式去搜集被监控对象的 Metrics 数据(监控指标数据),然后,再把这些数据保存在一个 TSDB (时间序列数据库,比如 OpenTSDB InfluxDB 等)当中,以便后续可以按照时间进行检索。
Pushgateway :允许被监控对象以 Push 的方式向Prometheus 推送 Metrics 数据
Alertmanager :可以根据 Metrics 信息灵活地设置报警
Grafana :对外暴露出的、可以灵活配置的监控数据可视化界面

1.1、Metrics 数据的来源

  • 第一种 Metrics,是宿主机的监控数据
    • 这部分数据的提供,需要借助一个由 Prometheus 护的Node Exporter 工具,就是代替被监控对象来对Prometheus 暴露出可以被抓取Metrics 信息的一个辅助进程。
  • 第二种 Metrics ,是来自于 Kubernetes API Server 、kubelet 等组件的 /metrics API
    • 除了常规的 CPU 、内存的信息外,这部分信息还主要包括了各个组件的核心监控指标。比如,对于 API Server 来说,它就会在 /metrics API 里,暴露出各个 Controller 的工作队列( Work Queue )的长度、请 求的 QPS 和延迟数据等等。这些信息,是检查
      Kubernetes 本身工作情况的主要依据。​​​​​​​
  • 第三种 Metrics ,是 Kubernetes 相关的监控数据
    • ​​​​​​​ 这部分数据,一般叫作 Kubernetes 核心监控数据(core metrics )。这其中包括了 Pod Node 、容器、Service 等主要 Kubernetes 核心概念的Metrics。
    • 这里提到的 Kubernetes 核心监控数据,其实使用的是 Kubernetes 的一个非常重要的扩展能力,叫作Metrics Server。在社区的定位,是用来取代Heapster。
在具体的监控指标规划上,建议你 遵循业界通用的 USE 则和 RED 原则
USE 原则指的是,按照如下三个维度来规划资源监控指标(原则是主要关注“ 资源
  • 利用率(Utilization),资源被有效利用起来提供服务的平均时间占比;
  • 饱和度(Saturation),资源拥挤的程度,比如工作队列的长度;
  • 错误率(Errors),错误的数量。

RED 原则指的是,按照如下三个维度来规划服务监控指标 (原则是主要关注“ 服务
  1. 每秒请求数量(Rate);
  2. 每秒错误数量(Errors);
  3. 服务响应时间(Duration)。

2、日志收集与管理

Kubernetes 中对容器日志的处理方式 , 都叫做 cluster-level-logging,即这个日志处理系统,与容器、 Pod 以及 Node 的生命周期都是完全无关的。这种设计当然是为了保证,无论是容器挂了、Pod 被删除,甚至节点宕机的时候,应用的日志依然可以被正常获取到。
第一种,在 Node 上部署 logging agent ,将日志文件转发 到后端存储里保存起来 ,架构图如下

 

这里的核心在于 logging agent ,它一般都会以DaemonSet 的方式运行在节点上,然后将宿主机上的容器日志目录挂载进去,最后由 logging-agent 把日志转发出去。
优势 :在 Node 上部署 logging agent ,在于一个节点只需要部署一个 agent ,并且不会对应用和 Pod 有任何侵入性。
不足 :要求应用输出的日志,都必须是直接输出到容器的stdout 和 stderr 里。即如果每秒日志量很大时,直接输出到容器的stdout stderr, 很容易就把系统日志配额用满,因为对系统默认日志工具是针对单服务( 例如 docker) 而不是进程进行限额的,最终导致的结果就是日志被吞掉。解决办法一个是增加配额,一个是给容器挂上存储,将日志输出到存储上
stdout stderr stdout 是标准输出, stderr 是错误输出
第二种,就是对这种特殊情况的一个处理,即当容器的日志 只能输出到某些文件里的时候,我们可以通过一个 sidecar 容器把这些日志文件重新输出到 sidecar stdout stderr 上,这样就能够继续使用第一种方案了。 架构图如下

 

不足 :宿主机上实际上会存在两份相同的日志文件一份是应用自己写入的;另一份则是 sidecar stdout stderr 对应的 JSON 文件。这对磁盘是很大的浪费,除非万不得已或者应用容器完全不可能被修改,否则不要使用这个方案

 

第三种方案,就是通过一个 sidecar 容器,直接把应用的日 志文件发送到远程存储里面去 ,架构图如下

 

优势 :直接把日志输出到固定的文件里而不是 stdout ,logging-agent 可以使用 uentd ,后端存储可以是
ElasticSearch 。部署简单,对宿主机友好。  
不足 :这个 sidecar 容器很可能会消耗较多的资源,甚至拖垮应用容器。并且,由于日志还是没有输出到 stdout 上,所以你通过 kubectl logs 是看不到任何日志输出的。
最后,无论是哪种方案,都必须要及时将这些日志文件从宿主机上清理掉,或者给日志目录专门挂载一些容量巨大的远程盘。否则,一旦主磁盘分区被打满,整个系统就可能会陷入奔溃状态。
http://www.lryc.cn/news/380263.html

相关文章:

  • C语言入门4-函数和程序结构
  • 分行业二氧化碳排放数据
  • 【OS基础】符合AUTOSAR标准的RTAOS-Alarms详解
  • 基于Java的学生成绩管理系统
  • 都2024年了,还有人不懂动态代理么?
  • ARM功耗管理框架之PPU
  • 说说 SSL 的错误认识和不足之处
  • Go语言day1
  • 【Python机器学习】利用t-SNE进行流形学习
  • 03 - matlab m_map地学绘图工具基础函数 - 设置坐标系(m_coord)
  • UEC++ 虚幻5第三人称射击游戏(一)
  • java小代码(1)
  • SLAM ORB-SLAM2(27)词袋模型
  • OpenAI 的 GPT-5:CTO米拉-穆拉提说,到 2026 年将实现博士级智能(Ph.D.-Level))
  • macbook配置adb环境和用adb操作安卓手机
  • 微软TTS最新模型,发布9种更真实的AI语音
  • python爬虫 -爬取 json 格式数据
  • Pytorch(5)-----梯度计算
  • C#的膨胀之路:创新还是灭亡
  • SpringBoot 过滤器和拦截器的区别
  • 协程执行顺序引发的问题
  • android webview调用js滚动到指定位置
  • WPF 深入理解一、基础知识介绍
  • 腾讯云点播ugc upload | lack signature 问题处理
  • 计算机视觉实验二:基于支持向量机和随机森林的分类(Part one: 编程实现基于支持向量机的人脸识别分类 )
  • 5.什么是C语言
  • DINO-DETR
  • Representation RL:HarmonyDream: Task Harmonization Inside World Models
  • Centos7系统下Docker的安装与配置
  • 无人机校企合作