当前位置: 首页 > news >正文

【2023】Prometheus-Alertmanager高可用集群

本次实验准备了三个节点,分别为laert-01~03

目录

  • 1.安装Alertmanager
  • 2.配置启动文件
  • 3.验证集群
  • 4.关于集群的配置项

1.安装Alertmanager

这部分内容在三个节点上都要执行

  • 下载安装包,将安装包解压至/data目录下
wget https://github.com/prometheus/alertmanager/releases/download/v0.25.0/alertmanager-0.25.0.linux-amd64.tar.gz
mkdir /data
tar -xf alertmanager-0.25.0.linux-amd64.tar.gz -C /data
ln -s /data/alertmanager-0.25.0.linux-amd64/ /data/alertmanager

2.配置启动文件

  • alert-01配置:

        vi /usr/lib/systemd/system/alertmanager.service 
    
[Unit]
Description=Prometheus Alertmanager Service daemon
After=network.target[Service]
Type=simple
User=root
Group=root
ExecStart=/data/alertmanager/alertmanager\--config.file=/data/alertmanager/alertmanager.yml\--storage.path=/data/alertmanager/data/\--data.retention=120h\--web.external-url=http://192.168.10.3:9093\--web.listen-address=:9093 \--cluster.listen-address=192.168.10.3:9094Restart=on-failure[Install]
WantedBy=multi-user.target
systemctl daemon-reload 
systemctl start alertmanager.service 
systemctl enable alertmanager.service 
systemctl status alertmanager.service 
  • alert-02配置

      vi /usr/lib/systemd/system/alertmanager.service 
    
[Unit]
Description=Prometheus Alertmanager Service daemon
After=network.target[Service]
Type=simple
User=root
Group=root
ExecStart=/data/alertmanager/alertmanager\--config.file=/data/alertmanager/alertmanager.yml\--storage.path=/data/alertmanager/data/\--data.retention=120h\--web.external-url=http://192.168.10.4:9093\--web.listen-address=:9093 \--cluster.listen-address=192.168.10.4:9094 \--cluster.peer=192.168.10.3:9094Restart=on-failure[Install]
WantedBy=multi-user.target
systemctl daemon-reload 
systemctl start alertmanager.service 
systemctl enable alertmanager.service 
systemctl status alertmanager.service 
  • alert-03配置

      vi /usr/lib/systemd/system/alertmanager.service
    
[Unit]
Description=Prometheus Alertmanager Service daemon
After=network.target[Service]
Type=simple
User=root
Group=root
ExecStart=/data/alertmanager/alertmanager\--config.file=/data/alertmanager/alertmanager.yml\--storage.path=/data/alertmanager/data/\--data.retention=120h\--web.external-url=http://192.168.10.5:9093\--web.listen-address=:9093 \--cluster.listen-address=192.168.10.5:9094 \--cluster.peer=192.168.10.3:9094Restart=on-failure[Install]
WantedBy=multi-user.target
systemctl daemon-reload 
systemctl start alertmanager.service 
systemctl enable alertmanager.service 
systemctl status alertmanager.service 

3.验证集群

  • 集群任意节点IP通过浏览器访问查看集群状态

在这里插入图片描述

  • 当某节点挂了,还由其他节点可使用
    在这里插入图片描述

4.关于集群的配置项

# 当前实例集群服务监听地址,为空则禁用高可用功能
--cluster.listen-address="0.0.0.0:9094"
# 表示集群节点对其他节点发布的地址,其他节点可以用这个地址与该地址通信
--cluster.advertise-address=CLUSTER.ADVERTISE-ADDRESS
# 用来设置该 Alertmanager 节点的集群对等体,将告警数据同步其他节点
--cluster.peer=CLUSTER.PEER
# 对等超时时间,默认15秒
--cluster.peer-timeout=15s
# 集群消息传播时间,默认200ms
--cluster.gossip-interval=200ms
# 定义了多个 Alertmanager 实例之间的信息同步频率
--cluster.pushpull-interval=10ms
# 评估通知之前等待集群连接建立的最长时间
--cluster.tcp-timeout=10s
# 在标记节点不正常之前等待确认的时间
--cluster.probe-timeout=500ms
# 随机节点探测之间的间隔
--cluster.probe-interval=1s
# 用来设置集群状态稳定的超时时间的参数
--cluster.settle-timeout=10ms
# 尝试重新连接到丢失的对等设备之间的间隔时间
--cluster.reconnect-interval=10s
# 尝试重新连接到丢失的对等设备的间隔时间
--cluster.reconnect-timeout=6h0m0s
# 用于在 Alertmanager 集群模式中配置 TLS 证书
--cluster.tls-config=""
# 允许节点发送不加密的广播请求,从而允许其他节点发现它的地址。
# 这条最好不用
--cluster.allow-insecure-public-advertise-address-discovery
http://www.lryc.cn/news/3009.html

相关文章:

  • 2023-2-11 刷题情况
  • 2019_41 考研408
  • Linux账号与用户组
  • 有趣的Hack-A-Sat黑掉卫星挑战赛——定位卫星Jackson
  • JAVA集合专题3 —— vector + LinkedList + Set
  • Scout:一款功能强大的轻量级URL模糊测试与爬取工具
  • leaflet 解决marker呈现灰色边框的问题
  • MySQL JSON类型字段的查找与更新
  • element Ui树状图控件 spring boot Vue 实现角色授权功能
  • 已解决sc delete MongoDB卸载MongoDB拒绝访问。
  • python的opencv操作记录11——阈值分割
  • Python-项目实战--飞机大战-英雄登场(7)
  • 寒假安全作业nginx-host绕过实例复现
  • RocketMQ-消息消费模式 顺序消费
  • 一、Java并发编程之线程、synchronized
  • 12.hadoop系列之MapReduce分区实践
  • 有了独自开,一个人就是一个团队
  • web期末复习 2023.02.11
  • 第44章 用户密码实体及其约束规则的定义实现
  • 聊聊并发与锁
  • 开源项目 —— 原生JS实现斗地主游戏 ——代码极少、功能都有、直接粘贴即用
  • Linux第四讲
  • Redis 持久化
  • Python语言零基础入门教程(十三)
  • 江苏五年制专转本应该复习几轮?
  • 微信小程序的优化方案之主包与分包的研究
  • 从手工测试转型web自动化测试继而转型成专门做自动化测试的学习路线。
  • 【计组笔记03】计算机组成原理之系统五大部件介绍、主存模型和CPU结构介绍
  • 微信小程序解析用户加密数据
  • 毕业四年换了3份软件测试工作,我为何仍焦虑?