当前位置: 首页 > news >正文

SkyWalking 告警功能

SkyWalking 告警功能是在 6.x 版本新增的,其核心由一组规则驱动,这些规则定义在config/alarm-settings.yml文件中。

告警规则

  • 告警规则:它们定义了应该如何触发度量警报,应该考虑什么条件。
  • Webhook(网络钩子):定义当警告触发时,哪些服务终端需要被告知。

常用告警规则

SkyWalking 的发行版都会默认提供config/alarm-settings.yml文件,里面预先定义了一些常用的告警规则。如下:

  • 过去 3 分钟内服务平均响应时间超过 1 秒。
  • 过去 2 分钟服务成功率低于80%。
  • 过去 3 分钟内服务响应时间超过 1s 的百分比
  • 服务实例在过去 2 分钟内平均响应时间超过 1s,并且实例名称与正则表达式匹配。
  • 过去 2 分钟内端点平均响应时间超过 1 秒。
  • 过去 2 分钟内数据库访问平均响应时间超过 1 秒。
  • 过去 2 分钟内端点关系平均响应时间超过 1 秒。

这些预定义的告警规则,打开config/alarm-settings.yml文件即可看到

告警规则配置项的说明

  • Rule name:规则名称,也是在告警信息中显示的唯一名称。必须以_rule结尾,前缀可自定义
  • Include names:该规则作用于哪些实体名称,比如服务名,终端名(可选,默认为全部)
  • Exclude names:该规则作不用于哪些实体名称,比如服务名,终端名(可选,默认为空)
  • Threshold:阈值
  • OP: 操作符,目前支持 >、
  • Period:多久告警规则需要被核实一下。这是一个时间窗口,与后端部署环境时间相匹配
  • Count:在一个Period窗口中,如果values超过Threshold值(按op),达到Count值,需要发送警报
  • Silence period:在时间N中触发报警后,在TN -> TN + period这个阶段不告警。 默认情况下,它和Period一样,这意味着相同的告警(在同一个Metrics name拥有相同的Id)在同一个Period内只会触发一
http://www.lryc.cn/news/452272.html

相关文章:

  • 国内旅游:现状与未来趋势分析
  • 西电25考研 VS 24考研专业课大纲变动汇总
  • 【Linux】进程管理:状态与优先级调度的深度分析
  • 同轴电缆笔记
  • 【Verilog学习日常】—牛客网刷题—Verilog企业真题—VL74
  • 在Linux系统安装Nginx
  • C初阶(六)--- static 来喽
  • Git版本控制工具--关于命令
  • 【iOS】计算器的仿写
  • 报错 libgomp.so.1, needed by vendor/llama.cpp/ggml/src/libggml.so, not found
  • wsl(3) -- USB使用
  • 从原理到代码:如何通过 FGSM 生成对抗样本并进行攻击
  • 从零开始学习OMNeT++系列第一弹——OMNeT++的介绍与安装
  • Cluster Explanation via Polyhedral Descriptions
  • 爬虫设计思考之一
  • 解决centos 删除文件后但空间没有释放
  • 微软SCCM:企业级系统管理的核心工具
  • RTSP作为客户端 推流 拉流的过程分析
  • 【MySQL 07】内置函数
  • 《深度学习》OpenCV 背景建模 原理及案例解析
  • 机器学习(1):机器学习的概念
  • 0. Pixel3 在Ubuntu22下Android12源码拉取 + 编译
  • ip经过多个服务器转发会网速变慢吗
  • mongodb通过mongoimport导入JSON文件数据
  • 【Qt】控件概述 (1)
  • ping基本使用详解
  • Win10之解决:设置静态IP后,为什么自动获取动态IP问题(七十八)
  • 【AI论文精读1】针对知识密集型NLP任务的检索增强生成(RAG原始论文)
  • 踩坑spring cloud gateway /actuator/gateway/refresh不生效
  • 【STM32开发环境搭建】-3-STM32CubeMX Project Manager配置-自动生成一个Keil(MDK-ARM) 5的工程