当前位置: 首页 > news >正文

HAProxy 和负载均衡概念简介

简介

HAProxy,全称高可用代理,是一款流行的开源软件 TCP/HTTP 负载均衡器和代理解决方案,可在 Linux、macOS 和 FreeBSD 上运行。它最常见的用途是通过将工作负载分布到多台服务器(例如 Web、应用程序、数据库)上来提高服务器环境的性能和可靠性。它被广泛应用于许多知名环境,包括 GitHub、Imgur、Instagram 和 Twitter。

在本指南中,您将获得 HAProxy 的概述,了解负载平衡术语,并举例说明如何使用它来提高您自己服务器环境的性能和可靠性。

HAProxy 术语

在讨论负载平衡和代理时,有许多重要的术语和概念。您将在以下小节中了解常用术语。

在深入了解基本负载平衡类型之前,您应该先了解 ACL、后端和前端。

访问控制列表(ACL)

在负载平衡方面,ACL 用于测试某些条件并根据测试结果执行操作(例如选择服务器或阻止请求)。使用 ACL 可以根据各种因素(如模式匹配和对后端的连接数)灵活地转发网络流量。

ACL 示例:

acl url_blog path_beg /blog

如果用户请求的路径以 /blog 开头,则匹配此 ACL。例如,这将匹配请求 http://yourdomain.com/blog/blog-entry-1

有关 ACL 使用的详细指南,请查看 HAProxy 配置手册。

后端

后端是接收转发请求的一组服务器。后端在 HAProxy 配置的 backend 部分中定义。在其最基本形式中,后端可以通过以下方式定义:

  • 使用的负载平衡算法
  • 服务器和端口列表

后端可以包含一个或多个服务器。一般来说,向后端添加更多服务器将通过在多台服务器上分发负载来增加潜在的负载容量。通过这种方式还可以实现增加可靠性,以防一些后端服务器不可用。

以下是一个包含两个后端配置的示例,web-backendblog-backend,每个后端中有两台 Web 服务器,监听端口 80:

backend web-backendbalance roundrobinserver web1 web1.yourdomain.com:80 checkserver web2 web2.yourdomain.com:80 checkbackend blog-backendbalance roundrobinmode httpserver blog1 blog1.yourdomain.com:80 checkserver blog1 blog1.yourdomain.com:80 check

balance roundrobin 行指定了负载平衡算法,详细信息请参阅负载平衡算法部分。

mode http 指定将使用第 7 层代理,这在负载平衡类型部分有解释。

server 指令末尾的 check 选项指定应对这些后端服务器执行健康检查。

前端

前端定义了如何将请求转发到后端。前端在 HAProxy 配置的 frontend 部分中定义。它们的定义由以下组件组成:

  • 一组 IP 地址和端口(例如 10.1.1.7:80、*:443 等)
  • ACL
  • use_backend 规则,根据匹配的 ACL 条件定义使用哪个后端,和/或一个 default_backend 规则,处理其他所有情况

前端可以配置到各种类型的网络流量,如下一节所述。

负载平衡类型

现在您已经了解了负载平衡中使用的基本组件,可以进入基本负载平衡类型。

无负载平衡

没有负载平衡的简单 Web 应用环境可能如下所示:

!无负载平衡

在此示例中,用户直接连接到您的 Web 服务器,位于 yourdomain.com,没有负载平衡。如果您的单个 Web 服务器宕机,用户将无法访问您的 Web 服务器。此外,如果许多用户尝试同时访问您的服务器,而服务器无法处理负载,他们可能会体验缓慢或无法连接的情况。

第 4 层负载平衡

将网络流量负载均衡到多台服务器的最简单方法是使用第 4 层(传输层)负载平衡。通过这种方式进行负载平衡将根据 IP 范围和端口转发用户流量(即,如果请求进入 http://yourdomain.com/anything,流量将被转发到处理 yourdomain.comport 80 所有请求的后端)。有关第 4 层的更多详细信息,请查看我们的网络入门中的 TCP 小节。

以下是第 4 层负载平衡的简单示例图:

!第 4 层负载平衡

用户访问负载均衡器,负载均衡器将用户的请求转发到后端服务器组 web-backend。选择的后端服务器将直接响应用户的请求。一般来说,web-backend 中的所有服务器应提供相同的内容,否则用户可能会收到不一致的内容。请注意,两台 Web 服务器都连接到同一数据库服务器。

第七层负载均衡

另一种更复杂的负载均衡网络流量的方式是使用第七层(应用层)负载均衡。使用第七层允许负载均衡器根据用户请求的内容将请求转发到不同的后端服务器。这种负载均衡模式允许您在相同的域和端口下运行多个 Web 应用服务器。有关第七层的更多细节,请查看我们的网络入门指南中的 HTTP 子部分。

以下是一个简单示例的第七层负载均衡的图表:

!Layer 7 Load Balancing

在这个示例中,如果用户请求 yourdomain.com/blog,他们将被转发到 blog 后端,这是一组运行博客应用的服务器。其他请求将被转发到 web-backend,可能正在运行另一个应用程序。在这个示例中,两个后端都使用相同的数据库服务器。

示例前端配置的片段如下:

frontend httpbind *:80mode httpacl url_blog path_beg /bloguse_backend blog-backend if url_blogdefault_backend web-backend

这配置了一个名为 http 的前端,它处理端口 80 上的所有传入流量。

acl url_blog path_beg /blog 匹配用户请求路径以 /blog 开头的请求。

use_backend blog-backend if url_blog 使用 ACL 将流量代理到 blog-backend

default_backend web-backend 指定所有其他流量将被转发到 web-backend

负载均衡算法

所使用的负载均衡算法决定了在负载均衡时将选择后端中的哪个服务器。HAProxy 提供了几种算法选项。除了负载均衡算法外,服务器可以被分配一个 weight 参数,以调整服务器相对于其他服务器的选择频率。

一些常用的算法如下:

roundrobin

Round Robin 按顺序选择服务器。这是默认算法。

leastconn

选择连接数最少的服务器。这适用于较长的会话。同一后端中的服务器也会以 Round Robin 方式轮换。

source

根据用户发起请求的源 IP 地址的哈希选择要使用的服务器。此方法确保相同的用户将连接到相同的服务器。

粘性会话

一些应用程序要求用户继续连接到相同的后端服务器。这可以通过 粘性会话 实现,使用后端中需要的 appsession 参数。

健康检查

HAProxy 使用健康检查来确定后端服务器是否可用于处理请求。这避免了在服务器变得不可用时手动从后端移除服务器。默认的健康检查是尝试建立到服务器的 TCP 连接。

如果服务器未通过健康检查,因此无法提供服务,它将自动在后端中禁用,并且流量将不会被转发到它,直到它再次变得健康。如果后端中的所有服务器都失败,服务将变得不可用,直到其中至少一个后端服务器再次变得健康。

对于某些类型的后端,比如数据库服务器,默认的健康检查未必是为了确定服务器是否仍然健康。

Nginx Web 服务器也可以用作独立的代理服务器或负载均衡器,并且通常与 HAProxy 一起使用,以利用其缓存和压缩功能。

高可用性

本教程中描述的第四层和第七层负载均衡设置都使用负载均衡器将流量引导到多个后端服务器之一。然而,在这些设置中,负载均衡器是一个单点故障;如果它崩溃或被请求压倒,它可能会导致服务的高延迟或停机。

高可用性(HA)设置广义上定义为没有单点故障的基础架构。通过为架构的每一层添加冗余,它可以防止单个服务器故障成为停机事件。负载均衡器为后端层(Web/应用服务器)提供了冗余,但要实现真正的高可用性设置,您还需要具有冗余负载均衡器。

以下是一个高可用性设置的图表:

!HA Setup

在这个示例中,您有多个负载均衡器(一个活动和一个或多个被动)位于静态 IP 地址后面,可以从一个服务器重新映射到另一个服务器。当用户访问您的网站时,请求通过外部 IP 地址到达活动负载均衡器。如果该负载均衡器失败,您的故障转移机制将检测到它,并自动将 IP 地址重新分配给一个被动服务器。有多种不同的方法可以实现主/备高可用性设置。要了解更多,请阅读《如何使用保留 IP》。

结论

现在您已经了解了负载均衡,并知道如何利用 HAProxy,您已经有了一个坚实的基础,可以开始改善自己服务器环境的性能和可靠性。

如果您有兴趣存储 HAProxy 的输出以供以后查看,请查看 如何在 CentOS 8 上使用 Rsyslog 配置 HAProxy 日志记录 [快速入门]

如果您正在寻求解决问题,请查看常见的 HAProxy 错误。如果需要进一步的故障排除,请查看《如何排除常见的 HAProxy 错误》。

http://www.lryc.cn/news/294699.html

相关文章:

  • 【go】ent操作之CRUD与联表查询
  • 服务器性能监控管理方法及工具
  • AUTOSAR汽车电子嵌入式编程精讲300篇-基于FPGA和CAN协议2.0B的总线控制器研究与设计
  • 14.1 Ajax与JSON应用(❤❤)
  • ffmpeg命令生成器
  • JavaScript基础速成
  • openGauss学习笔记-215 openGauss性能调优-确定性能调优范围-性能日志
  • 在vs code的terminal,debug执行python main.py --train True
  • docker 简单项目
  • 计算机毕业设计 基于SpringBoot的线上教育培训办公系统的设计与实现 Java实战项目 附源码+文档+视频讲解
  • 四、机器学习基础概念介绍
  • Excel设置单元格下拉框(poi)
  • api接口是什么意思,api接口该如何防护呢?
  • PMP资料怎么学?PMP备考经验分享
  • partition by list(msn_id)子句的含义
  • 【C++】I/O多路转接详解(二)
  • PySpark(三)RDD持久化、共享变量、Spark内核制度,Spark Shuffle
  • 详解MYSQL中的平均值组大小
  • 【爬虫专区】批量下载PDF (无反爬)
  • PostgreSQL解决序列(自增id)自动增长冲突
  • 1.0 Zookeeper 分布式配置服务教程
  • (Flutter 常用插件整理
  • vue2.0+使用md-edit编辑器
  • Java设计模式大全:23种常见的设计模式详解(二)
  • 【算法与数据结构】718、1143、1035、392、115、LeetCode最长重复子数组+最长公共子序列+不相交的线+判断子序列+不同的子序列
  • OCR文本纠错思路
  • 【java批量导出pdf】优化方案
  • Linux第42步_移植ST公司uboot的第3步_uboot命令测试,搭建nfs服务器和tftp服务器
  • C++枚举算法(3)
  • 【51单片机】LED的三个基本项目(LED点亮&LED闪烁&LED流水灯)(3)