服务器负载均衡是什么意思（服务器负载均衡的基本功能和实现原理）

(编辑：jimmy 日期: 2026/3/7 浏览：3 次 )

什么是负载均衡？

负载均衡是由多台服务器以对称的方式组成一个服务器集合，每台服务器都具有等价的地位，都可以单独对外供应效力而无须其他服务器的辅助。经过某种负载分管技术，将外部发送来的央求均匀分配到对称结构中的某一台服务器上，而接收到央求的服务器独登时回应客户的央求。均衡负载可以平均分配客户央求到服务器列阵，籍此供应快速获取重要数据，解决很多并发访问效力问题。这种群集技术可以用最少的出资取得接近于大型主机的性能。

负载均衡的类型

根据DNS的负载均衡

经过DNS效力中的随机姓名解析来完结负载均衡，在DNS服务器中，可认为多个不同的地址配置同一个姓名，而最终查询这个姓名的客户机将在解析这个姓名时得到其中一个地址。因此，关于同一个姓名，不同的客户时机得到不同的地址，他们也就访问不同地址上的Web服务器，然后达到负载均衡的目的。

反向署理负载均衡

运用署理服务器可以将央求转发给内部的Web服务器，让署理服务器将央求均匀地转发给多台内部Web服务器之一上，然后达到负载均衡的目的。这种署理方式与一般的署理方式有所不同，标准署理方式是客户运用署理访问多个外部Web服务器，而这种署理方式是多个客户运用它访问内部Web服务器，因此也被称为反向署理模式。Apusic负载均衡器就归于这种类型的。

根据NAT的负载均衡技术

网络地址变换为在内部地址和外部地址之间进行变换，以便具备内部地址的计算机能访问外部网络，而当外部网络中的计算机访问地址变换网关拥有的某一外部地址时，地址变换网关能将其转发到一个映射的内部地址上。因此如果地址变换网关能将每个衔接均匀变换为不同的内部服务器地址，尔后外部网络中的计算机就各自与自己变换得到的地址上服务器进行通讯，然后达到负载分管的目的。

负载均衡服务器的好处

由于网民数量激增，网络访问路径过长，用户的访问质量简略遭到严重影响，尤其是当用户与网站之间的链路被出人意料的流量拥塞时。而这种情况经常发生在异地互联网用户急速增加的运用上。这时候，如果在效力端运用负载均衡(GSLB)技术，就可以合理分管系统负载、提高系统可靠性、支持网站内容的虚拟化。在实际运用中，许多IDC，如互联通更是选用GSLB与Cache、Mirror相结合的方法来供应网络加速效力。负载均衡效力具有如下特点：

高智能化

运用虚拟IP(VIP)地址代表方针服务器和运用，将会话分配到最高可用性的服务器，全程监控每个会话，效力恢复后自动重新挂号，并转发客户机和服务器信息包时供应全地址变换。简略有用的负载均衡算法可以配置包括循环法、最少衔接法、散列法或最少失误法等多种不同的负载均衡方法，也可以对个别服务器配置最大衔接数量阈值和加权值，以防止服务器超载。

高可靠性

架构在专用的高速骨干网之上，该骨干网络供应延迟极小的网络连通性，然后保障GSLB的功能正常发挥和高性能，远远优于根据公网的GSLB。并且，当主站点机房的Internet 出口呈现毛病时，还能将用户自动、透明地从其他分站点Internet入口导向主站点服务器。

高可用性

选用热备份方法，在极短时间内对服务器链路、交换端口和交换机进行检测和毛病转移，使运用免受毛病影响;任何一个服务器或服务器群发生毛病或阻塞，用户将被自动引导到下一个最佳备份服务器或站点，然后更进一步提高了效力和内容的可用性。

服务器负载均衡

网络的负载均衡是一种动态均衡技术，经过一些东西实时地分析数据包，掌握网络中的数据流量状况，把任务合理均衡地分配出去。

计算集中型的运用，比如电子商务网站，服务器计算负荷会很大;读写频繁的运用，比如网络数据库，存储系统则面临着检测;传输量大的运用，比如视频效力，数据总是无法快速传送，无法完结最好的效果;访问量大的运用，路由器与防火墙简略成为瓶颈。想要合理解决这些问题，晋级设备、改动拓扑是”笨办法”，相对巧妙的方法是选用负载均衡技术，用多个设备一起完结任务。

负载均衡技术根据现有网络结构，供应了一种扩展服务器带宽和增加服务器吞吐量的廉价有用的方法，加强了网络数据处理能力，提高了网络的灵活性和可用性。负载均衡的运用，可以有用地解决网络拥塞问题，可以就近供应效力，完结地理位置无关性(异地负载均衡)。同时，这项技术还能提高服务器的响应速度，提高服务器及其他资源的利用效率，防止网络关键部位呈现单点失效，然后为用户供应更好的访问质量。

本文介绍了负载均衡的基本功能和实现原理，看起来并不难，但负载均衡涉及的知识其实非常的广泛，根据各个用户系统的不同，我们要熟悉不同的协议和应用流程，甚至涉及到某些开发语言和软件平台，否则在出现故障的时候，我们可能没有能力做出有效的判断，从这个意义上来说，一个负载均衡设备的工程师要掌握网络，应用和系统等各方面的知识，这些都要当作基础来积累。

负载均衡设备作为纵跨网络2-7层协议的设备，往往放置在网络设备和应用设备的连接处，对工程师在网络和应用基本知识方面的要求远高于其他设备，所以我们要在基本功能的理解上下更多的功夫。负载均衡设备还有另外一个称呼：4/7层交换机，但它首先是个2-3层交换机，这要求我们首先掌握2-3层的基本知识，然后才是本文介绍的内容。

服务器负载均衡有三大基本Feature：负载均衡算法，健康检查和会话保持，这三个Feature是保证负载均衡正常工作的基本要素。其他一些功能都是在这三个功能之上的一些深化。下面我们具体介绍一下各个功能的作用和原理。

在没有部署负载均衡设备之前，用户直接访问服务器地址（中间或许有在防火墙上将服务器地址映射成别的地址，但本质上还是一对一的访问）。当单台服务器由于性能不足无法处理众多用户的访问时，就要考虑用多台服务器来提供服务，实现的方式就是负载均衡。负载均衡设备的实现原理是把多台服务器的地址映射成一个对外的服务IP（我们通常称之为VIP，关于服务器的映射可以直接将服务器IP映射成VIP地址，也可以将服务器IP:Port映射成VIP:Port，不同的映射方式会采取相应的健康检查,在端口映射时，服务器端口与VIP端口可以不相同）,这个过程对用户端是透明的，用户实际上不知道服务器是做了负载均衡的，因为他们访问的还是一个目的IP,那么用户的访问到达负载均衡设备后，如何把用户的访问分发到合适的服务器就是负载均衡设备要做的工作了，具体来说用到的就是上述的三大Feature。

我们来做一个详细的访问流程分析:

用户(IP:207.17.117.20)访问域名www.a10networks.com，首先会通过DNS查询解析出这个域名的公网地址：199.237.202.124，接下来用户207.17.117.20会访问199.237.202.124这个地址，因此数据包会到达负载均衡设备，接下来负载均衡设备会把数据包分发到合适的服务器，看下图：

负载均衡设备在将数据包发给服务器时，数据包是做了一些变化的，如上图所示，数据包到达负载均衡设备之前，源地址是：207.17.117.20，目的地址是：199.237.202.124, 当负载均衡设备将数据包转发给选中的服务器时，源地址还是：207.17.117.20,目的地址变为172.16.20.1，我们称这种方式为目的地址NAT(DNAT)。一般来说，在服务器负载均衡中DNAT是一定要做的（还有另一种模式叫做服务器直接返回-DSR，是不做DNAT的，我们将另行讨论），而源地址根据部署模式的不同，有时候也需要转换成别的地址，我们称之为：源地址NAT(SNAT)，一般来说，旁路模式需要做SNAT，而串接模式不需要，本示意图为串接模式，所以源地址没做NAT。

我们再看服务器的返回包，如下图所示，也经过了IP地址的转换过程，不过应答包中源/目的地址与请求包正好对调，从服务器回来的包源地址为172.16.20.1，目的地址为207.17.117.20,到达负载均衡设备后，负载均衡设备将源地址改为199.237.202.124，然后转发给用户，保证了访问的一致性。

以上是单个数据包的处理流程。那么负载均衡设备是怎么选择服务器的呢？这就是我们要介绍的第一个Feature:

负载均衡算法

一般来说负载均衡设备都会默认支持多种负载均衡分发策略，例如：

Ø 轮询（RoundRobin）将请求顺序循环地发到每个服务器。当其中某个服务器发生故障，AX就把其从顺序循环队列中拿出，不参加下一次的轮询，直到其恢复正常。

Ø 比率（Ratio）：给每个服务器分配一个加权值为比例，根椐这个比例，把用户的请求分配到每个服务器。当其中某个服务器发生故障，AX就把其从服务器队列中拿出，不参加下一次的用户请求的分配，直到其恢复正常。

Ø 优先权（Priority）：给所有服务器分组，给每个组定义优先权，将用户的请求分配给优先级最高的服务器组（在同一组内，采用预先设定的轮询或比率算法，分配用户的请求）；当最高优先级中所有服务器或者指定数量的服务器出现故障，AX将把请求送给次优先级的服务器组。这种方式，实际为用户提供一种热备份的方式。

Ø 最少连接数（LeastConnection）：AX会记录当前每台服务器或者服务端口上的连接数，新的连接将传递给连接数最少的服务器。当其中某个服务器发生故障，AX就把其从服务器队列中拿出，不参加下一次的用户请求的分配，直到其恢复正常。

Ø 最快响应时间（Fast Reponse time）：新的连接传递给那些响应最快的服务器。当其中某个服务器发生故障，AX就把其从服务器队列中拿出，不参加下一次的用户请求的分配，直到其恢复正常。

以上为通用的负载均衡算法，还有一些算法根据不同的需求也可能会用到，例如：

Ø 哈希算法( hash): 将客户端的源地址，端口进行哈希运算，根据运算的结果转发给一台服务器进行处理，当其中某个服务器发生故障，就把其从服务器队列中拿出，不参加下一次的用户请求的分配，直到其恢复正常。

Ø 基于策略的负载均衡：针对不同的数据流设置导向规则，用户可自行编辑流量分配策略，利用这些策略对通过的数据流实施导向控制。

Ø 基于数据包的内容分发：例如判断HTTP的URL，如果URL中带有.jpg的扩展名，就把数据包转发到指定的服务器。

继续看图分析，第二个用户207.17.117.21也访问www.a10networks.com，负载均衡设备根据负载均衡算法将第二个用户的请求转发到第二台服务器来处理。

假设在工作过程中，突然有一台服务器出现问题怎么办？这就涉及到我们要介绍的第二个Feature:

健康检查

健康检查用于检查服务器开放的各种服务的可用状态。负载均衡设备一般会配置各种健康检查方法，例如Ping，TCP，UDP，HTTP，FTP，DNS等。Ping属于第三层的健康检查，用于检查服务器IP的连通性，而TCP/UDP属于第四层的健康检查，用于检查服务端口的UP/DOWN，如果要检查的更准确，就要用到基于7层的健康检查，例如创建一个HTTP健康检查，Get一个页面回来，并且检查页面内容是否包含一个指定的字符串，如果包含，则服务是UP的，如果不包含或者取不回页面，就认为该服务器的Web服务是不可用（DOWN）的。如下图所示，负载均衡设备检查到172.16.20.3这台服务器的80端口是DOWN的，负载均衡设备将不把后面的连接转发到这台服务器，而是根据算法将数据包转发到别的服务器。创建健康检查时可以设定检查的间隔时间和尝试次数，例如设定间隔时间为5秒，尝试次数为3，那么负载均衡设备每隔5秒发起一次健康检查，如果检查失败，则尝试3次，如果3次都检查失败，则把该服务标记为DOWN，然后服务器仍然会每隔5秒对DOWN的服务器进行检查，当某个时刻发现该服务器健康检查又成功了，则把该服务器重新标记为UP。健康检查的间隔时间和尝试次数要根据综合情况来设置，原则是既不会对业务产生影响，又不会对负载均衡设备造成较大负担。

假设是同一个用户继续访问，后续的连接会怎么处理呢？看下图：

用户207.17.117.25之前发起的第一个连接是207.17.117.25：4003-〉199.237.202.127:80，负载均衡设备将该连接转发到了172.16.20.4，接着发起第二个连接207.17.117.25：4004-〉199.237.202.127:80，我们看到该连接还是转发到了服务器172.16.20.4，为什么呢？因为负载均衡设备配置了会话保持。

会话保持

会话保持用于保持会话的连续性和一致性，由于服务器之间很难做到实时同步用户访问信息，这就要求把用户的前后访问会话保持到一台服务器上来处理。举个例子，用户访问一个电子商务网站，如果用户登录时是由第一台服务器来处理的，但用户购买商品的动作却由第二台服务器来处理，第二台服务器由于不知道用户信息，所以本次购买就不会成功。这种情况就需要会话保持，把用户的操作都通过第一台服务器来处理才能成功。当然并不是所有的访问都需要会话保持，例如服务器提供的是静态页面比如网站的新闻频道，各台服务器都有相同的内容，这种访问就不需要会话保持。

负载均衡设备一般会默认配置一些会话保持的选项，例如源地址的会话保持，Cookie会话保持等，基于不同的应用要配置不同的会话保持，否则会引起负载的不均衡甚至访问异常。具体可参考本人的另一篇拙作：《不同应用环境下会话保持方式的选择》。

上一篇：linux利用read命令获取变量中的值
下一篇：Linux本机与服务器文件互传及Linux服务器文件上传下载命令写法