当前位置: 首页 > news >正文

zabbix精简模板

一、监控项目介绍

linux自带得监控项目比较多,也不计较杂,很多监控项目用不到。所以这里要做一个比较精简得监控模版

二、监控模板克隆

1.搜索原模板

在这里插入图片描述

2.克隆模板

全克隆模板,这样就和原来原模板没有联系了,操作也不会影响原模板。这里是对被动模式的模板进行克隆,因为主动模式的模板有些监控没有,还需要再次添加,所以这里选择了对被动模式的模板进行克隆。

在这里插入图片描述

3.自定义名称

在这里插入图片描述

再次搜索 模板已经克隆完成

4.裁剪模板

一定要对克隆后得模版进行裁剪,不要对源模板进行裁剪。不需要的监控项目删除就可以了。裁剪后的模板剩下的监控项目如下:

监控项目含义
Available memory可用内存(free -h 中available的值)
Available memory in %可用内存百分比(上边的百分比值)
Load average (1m avg)1分钟以前的系统负载
Load average (5m avg)5分钟以前的系统负载
Load average (15m avg)15分钟以前的系统负载
Available memory in %: Memory utilization内存利用率,监控一般使用此项比较方便
Number of CPUscpu的核心数量
System local time系统时间,时间不同步看此选项
System uptime启动运行了多少时间,单位是秒
Total memory内存总大小
Zabbix agent availabilityagent是否存活,决定zabbix是否会变绿色的监控项目
Zabbix agent ping是否能够ping通agent,ping通返回1,否则返

5.修改主动模式

监控项目类型
Available memoryZabbix客户端(主动式)
Available memory in %Zabbix客户端(主动式)
Load average (1m avg)Zabbix客户端(主动式)
Load average (5m avg)Zabbix客户端(主动式)
Load average (15m avg)Zabbix客户端(主动式)
Available memory in %: Memory utilization相关项目
Number of CPUsZabbix客户端(主动式)
System local timeZabbix客户端(必须被动模式)
System uptimeZabbix客户端(主动式)
Total memoryZabbix客户端(主动式)
Zabbix agent availabilityZabbix内部
Zabbix agent pingZabbix客户端(主动式)

6.禁用自动发现规则

目前来讲我会禁用以下规则

Block devices discovery 
Network interface discovery 此选项根据主机来决定是否启用

7.修改触发器名称

监控项目原触发器名称修改后触发器名称
Available memoryLack of available memory
Available memory in %
Load average (1m avg)Load average is too high系统负载过高
Load average (5m avg)同上
Load average (15m avg)同上
Available memory in %: Memory utilizationHigh memory utilization内存使用率超过xxx%
System local timeSystem time is out of sync系统时间不同步
System uptimehas been restarted主机发生重启
Zabbix agent availabilityZabbix agent is not availablezabbix_agent无效

注意:

发送报警邮件的时间,取决于触发器状态由 “正常” 状态变为 "问题"状态的时间。
例如:zabbix_agent 宕机了,zabbix_agent 的图标由绿色变为了红色,但是只要触发器中的状态没有从 “正常” 变为 “问题” ,就不会发送报警信息。
之所以会有这种问题,是 触发器表达式接收到最新数据后,会重新对表达式进行计算,这个计算时间和 “图标显示” 还有 "问题"处的显示 计算时间不是同步开始的,所以出现了好像报警延迟的问题。
还有就是表达式式本身的写法,时间比较长。所以会报警延迟。

8.修改触发器表达式

1.修改之前的说明:
(1)触发器中的 “名称” 对应 {TRIGGER.NAME} 变量。 这个变量在 “动作” --> “操作” --> "自定义消息内容"中使用。

(2)触发器中的 “事件名称” 是在 “监测” --> “问题” --> “问题”,如下图:

在这里插入图片描述

其中{HOST.NAME}变量的值是 主机 中的 “可见名称”

2.Zabbix agent availability
删除模板中的原有触发器表达式,使用last函数生成表达式,基数和时间参数不填写。

报警表达式:
last(xxxx)=0恢复表达式
last(xxxx)=1

3.has been restarted

报警表达式
last(xxxxx)<8m

4.System time is out of sync

时间监控得监控项目必须是被动模式,此监控项得值是linux的时间戳,也就是date +%s的值

报警表达式
fuzzytime(/winning_winex_template/system.localtime,60s)=0

5.Load average is too high

系统1分钟以前的负载大于cpu的核心数量就报警

报警表达式last(xxxxx/system.cpu.load[all,avg1])>=last(xxxx/system.cpu.num)恢复表达式last(xxxxx/system.cpu.load[all,avg1])<last(xxxx/system.cpu.num)

6.Available memory in %: Memory utilization

内存利用率超过90%就报警

报警表达式
last(/winning_winex_template/vm.memory.utilization)>90恢复表达式
last(/winning_winex_template/vm.memory.utilization)><90
http://www.lryc.cn/news/259567.html

相关文章:

  • GO设计模式——14、代理模式(结构型)
  • 外贸SOHO建站怎么做?海洋建站方法策略?
  • 商城免费搭建之java鸿鹄云商 java电子商务商城 Spring Cloud+Spring Boot+mybatis+MQ+VR全景+b2b2c
  • 【淘宝网消费类电子产品销售数据可视化】
  • AI编译器及TVM概述
  • 排序-归并排序与计数排序
  • 国产数据库适配-人大金仓(kingbase V8R3)
  • HAAS 哈斯机床 读写刀补数据
  • Visual studio+Qt开发环境搭建以及注意事项和打开qt的.pro项目
  • BUUCTF crypto做题记录(4)新手向
  • 【ArcGIS微课1000例】0080:ArcGIS将shp转json(geojson)案例教程
  • 阿里云Centos8安装Dockers详细过程
  • leetcode 二数之和 三数之和 四数之和
  • 制衣厂生产ERP系统怎么样?制衣厂生产ERP软件哪个好
  • 安装 DevEco Studio 后不能用本地 Node.js 打开
  • AppLink+WMS,实现仓储管理一体化
  • 如果是你,你选SOHO还是跟单?
  • 大语言模型--能力
  • 安装LLaMA-Factory微调chatglm3,修改自我认知
  • 以太网协议与DNS
  • Spring Boot的日志
  • Cisco Packet Tracer配置命令——交换机篇
  • python单例模式
  • 环境保护:人类生存的最后机会
  • 头歌-Python 基础
  • C++数据结构:B树
  • 【07】ES6:对象的扩展
  • flink找不到隐式项
  • 【网络编程】-- 04 UDP
  • 【脚本】图片-音视频-压缩文件处理