当前位置: 首页 > news >正文

Keepalived 监听服务切换与运维指南

文章目录

  • Keepalived 监听服务切换与运维指南
    • 一、监听服务切换方式
      • 1.1 HTTP_GET/SSL_GET
        • 状态码检测配置
        • 内容摘要检测配置
      • 1.2 TCP_CHECK
      • 1.3 MISC_CHECK
        • 脚本示例(HTTP服务检查)
        • 配置引用
      • 1.4 检查方式对比
    • 二、监听脚本示例
      • 2.1 HTTP/HTTPS服务检查
      • 2.2 TCP端口检查
      • 2.3 UDP端口检查
      • 2.4 进程状态检查
      • 2.5 状态切换通知脚本
    • 三、常用运维命令
      • 3.1 服务管理
      • 3.2 配置检查
      • 3.3 状态查看
      • 3.4 故障排查
    • 四、注意事项

Keepalived 监听服务切换与运维指南

一、监听服务切换方式

Keepalived 提供多种健康检查机制实现服务状态监测与自动切换,以下是常用方式及配置示例:

1.1 HTTP_GET/SSL_GET

基于 HTTP/HTTPS 协议的应用层检查,支持状态码验证和内容摘要校验。

状态码检测配置
real_server 192.168.1.100 80 {weight 1HTTP_GET {url {path /health.htmlstatus_code 200  # 期望返回状态码}connect_timeout 3    # 连接超时时间nb_get_retry 3       # 重试次数delay_before_retry 2 # 重试间隔}
}
内容摘要检测配置

使用 genhash 工具生成页面摘要:

genhash -s 192.168.1.100 -p 80 -u /index.html
# 输出示例:MD5SUM = b7bd8391367e4cf9e4e85263ce313ae8

配置文件引用:

real_server 192.168.1.100 80 {weight 1HTTP_GET {url {path /index.htmldigest b7bd8391367e4cf9e4e85263ce313ae8  # 生成的摘要值}connect_timeout 3nb_get_retry 3delay_before_retry 2}
}

1.2 TCP_CHECK

基于 TCP 协议的端口存活检查,适用于非 HTTP 服务(如数据库、SSH)。

real_server 192.168.1.101 3306 {weight 2inhibit_on_failure  # 故障时权重设为0TCP_CHECK {connect_port 3306      # 检查端口connect_timeout 5      # 超时时间nb_get_retry 3         # 重试次数delay_before_retry 3   # 重试间隔}
}

1.3 MISC_CHECK

自定义脚本检查,支持复杂业务逻辑判断(如多端口联动、日志关键字检测)。

脚本示例(HTTP服务检查)
#!/bin/bash
# /etc/keepalived/check_http.sh
CHECK_URL=$1
if curl -I -s "$CHECK_URL" | grep -q "200 OK"; thenexit 0  # 成功
elseexit 1  # 失败
fi
配置引用
real_server 192.168.1.102 80 {weight 1MISC_CHECK {misc_path "/etc/keepalived/check_http.sh http://192.168.1.102/index.html"misc_timeout 5  # 脚本超时时间# misc_dynamic  # 动态调整权重(可选)}
}

1.4 检查方式对比

方式优点缺点适用场景
HTTP_GET支持应用层健康度检测配置复杂Web服务
TCP_CHECK轻量、通用无法检测应用内部状态数据库、SSH等TCP服务
MISC_CHECK支持任意复杂逻辑需要维护脚本自定义业务逻辑

二、监听脚本示例

2.1 HTTP/HTTPS服务检查

#!/bin/bash
# 检查URL返回状态码
check_http() {local url=$1if curl -s -o /dev/null -w "%{http_code}" "$url" | grep -q "200"; thenexit 0elseexit 1fi
}
check_http "http://192.168.1.100/health"

2.2 TCP端口检查

#!/bin/bash
# 检查TCP端口连通性
check_tcp() {local host=$1local port=$2if nc -z -w 2 "$host" "$port"; thenexit 0elseexit 1fi
}
check_tcp "192.168.1.101" 3306

2.3 UDP端口检查

#!/bin/bash
# 检查UDP端口(需安装nc)
check_udp() {local host=$1local port=$2if nc -u -z -w 1 "$host" "$port" 2>/dev/null | grep -q "open"; thenexit 0elseexit 1fi
}
check_udp "192.168.1.102" 53

2.4 进程状态检查

#!/bin/bash
# 检查进程是否存活
check_process() {local proc_name=$1if pgrep -x "$proc_name" >/dev/null; thenexit 0elseexit 1fi
}
check_process "nginx"

2.5 状态切换通知脚本

#!/bin/bash
# /etc/keepalived/notify.sh
contact="admin@example.com"
notify() {local subject="$(hostname) 切换为 $1 状态"local body="$(date +'%F %T'): VIP 漂移,$(hostname) 成为 $1 节点"echo "$body" | mail -s "$subject" "$contact"
}case $1 inmaster) notify master ;;backup) notify backup ;;fault) notify fault ;;*) echo "Usage: $0 {master|backup|fault}" ;;
esac

配置引用

vrrp_instance VI_1 {# ... 其他配置 ...notify_master "/etc/keepalived/notify.sh master"notify_backup "/etc/keepalived/notify.sh backup"notify_fault "/etc/keepalived/notify.sh fault"
}

三、常用运维命令

3.1 服务管理

# 启动
systemctl start keepalived
# 停止
systemctl stop keepalived
# 重启
systemctl restart keepalived
# 开机自启
systemctl enable keepalived

3.2 配置检查

# 验证配置文件语法
keepalived -t -f /etc/keepalived/keepalived.conf
# 指定配置文件启动
keepalived -f /etc/keepalived/custom.conf

3.3 状态查看

# 查看服务状态
systemctl status keepalived
# 查看VRRP实例状态
ip addr show | grep "inet.*secondary"  # 查看VIP绑定
# 查看LVS规则
ipvsadm -Ln
# 查看日志
journalctl -u keepalived -f

3.4 故障排查

# 抓包分析VRRP报文
tcpdump -i eth0 vrrp -nn -vv
# 查看健康检查日志
grep "healthcheck" /var/log/keepalived.log
# 手动触发故障转移
systemctl stop keepalived  # 在主节点执行

四、注意事项

  1. 脚本权限:自定义脚本需设置执行权限 chmod +x /path/to/script.sh
  2. 防火墙配置:允许VRRP协议(多播地址224.0.0.18,协议号112)
  3. 非抢占模式:配置 nopreempt 避免主节点恢复后抢占VIP
  4. 日志配置:在 /etc/sysconfig/keepalived 中设置 KEEPALIVED_OPTIONS="-D -S 6" 输出详细日志
  5. SELinux:临时关闭 setenforce 0,或配置策略允许脚本执行
http://www.lryc.cn/news/593660.html

相关文章:

  • C study notes[1]
  • C语言:20250719笔记
  • CentOS 清理技巧
  • 第二次总结(xss、js原型链)
  • 在开发板tmp目录下传输文件很快的原因和注意事项:重启开发板会清空tmp文件夹,记得复制文件到其他地方命令如下(cp 文件所在路径 文件要复制到的路径—)
  • 【Linux】重生之从零开始学习运维之Nginx之server小实践
  • 定时器中BDTR死区时间和刹车功能配置
  • AWS Partner: Accreditation (Technical)
  • Qt Graphs 模块拟取代 charts 和 data visualization还有很长的路要走
  • SPARKLE:深度剖析强化学习如何提升语言模型推理能力
  • stm32继电器使用方法
  • 【RK3576】【Android14】UART开发调试
  • 从零开始学Tailwind CSS : 颜色配置原理与实践
  • EasyExcel使用
  • 创建套接字并bind的详细过程
  • 深度学习-线性神经网络
  • 深度学习Depth Anything V2神经网络实现单目深度估计系统源码
  • 短视频矩阵的未来前景:机遇无限,挑战并存
  • Maven常用知识总结
  • 代码随想录算法训练营第二十天|回溯part02
  • 电阻耐压参数学习总结
  • 动态规划——数位DP经典题目
  • 【深度学习-Day 38】破解深度网络退化之谜:残差网络(ResNet)核心原理与实战
  • 从0到1搭建一个Rag引擎(ollama+Qwen3)
  • 实现el-select下拉框,下拉时加载数据
  • Docker容器原理和启动策略
  • EP01:【Python 第一弹】基础入门知识
  • aosp15实现SurfaceFlinger的dump输出带上Layer详细信息踩坑笔记
  • 生成式人工智能实战 | 自回归模型详解与实现
  • Linux中添加重定向(Redirection)功能到minishell