LVS工作原理浅析

一、什么是LVS

        LVS是Linux Virtual Server的简写,意即Linux虚拟服务器,是一个虚拟的服务器集群系统。本项目在1998年5月由章文嵩博士成立,是中国国内最早出现的自由软件项目之一。

        LVS集群采用IP负载均衡技术和基于内容请求分发技术。调度器具有很好的吞吐率,将请求均衡地转移到不同的服务器上执行,且调度器自动屏蔽掉服务器的故障,从而将一组服务器构成一个高性能的、高可用的虚拟服务器。整个服务器集群的结构对客户是透明的,而且无需修改客户端和服务器端的程序。

        为此,在设计时需要考虑系统的透明性、可伸缩性、高可用性和易管理性。

二、LVS的结构

    LVS由前端的负载均衡器(Load Balancer,LB)和后端的真实服务器(Real Server,RS)群组成。RS间可通过局域网或广域网连接。LVS的这种结构对用户是透明的,用户只能看见一台作为LB的虚拟服务器(Virtual Server),而看不到提供服务的RS群。当用户的请求发往虚拟服务器,LB根据设定的包转发策略和负载均衡调度算法将用户请求转发给RS。RS再将用户请求结果返回给用户。

LVS结构.jpg

  负载均衡器一般存在单点故障,所以我们需要在LB节点上做HA。 实现的方法有:heartbeat,keepalived


三、LVS的内核模型

        LVS由前端的负载均衡器(Load Balancer,LB)和后端的真实服务器(Real Server,RS)群组成。RS间可通过局域网或广域网连接。LVS的这种结构对用户是透明的,用户只能看见一台作为LB的虚拟服务器(Virtual Server),而看不到提供服务的RS群。当用户的请求发往虚拟服务器,LB根据设定的包转发策略和负载均衡调度算法将用户请求转发给RS。RS再将用户请求结果返回给用户。

LVS内核模型.jpg

如上图所示,客户请求报文的走向路径

1:当客户端的请求到达负载均衡器的内核空间时,首先会到达PREROUTING链

2:当内核发现请求数据包的目的地址是本机时,会将数据包送往INPUT

3LVS由用户空间的ipvsadm和内核空间的IPVS组成,ipvsadm用来定义规则,ipvs利用ipvsadm定义的规则工作,I
PVS
工作在INPUT链上, 当数据包到达INPUT链时,首先会被IPVS检查,如果数据包里面的目标地址及端口没有在规则里面,
那么这条数据将被放行至用户空间。

4:如果数据包里面的目标地址及端口在规则里面,那么这条数据报文的目标地址为将被修改为事先定义的后端服务器地址,

并送往POSTROUTING链。

5:最后经由POSTROUTING链发往后端服务器


四、LVS集群的类型


Ⅰ:LVS-NAT 模型:多目标的DNAT,通过将请求报文中的目标地址和目标端口修改为挑选出的某RS的RIP和PORT实现转发;

NAT模型的特点:

(1)RIP和DIP必须在同一IP网段,且应该使用私有地址,RS的网关必须要指向DIP(保证响应报文必须经由VS)

    (2)请求报文和响应报文都经由Director转发,较高负载下,Director易于成为系统性能瓶颈。

    (3)支持端口映射;

    (4)VS必须是Linux,RS可以是任意OS;


LVS-NAT.jpg


如上图所示,客户端报文请求和响应报文走向路径;


1:客户端client将请求发往前段的负责均衡器,请求报文源IPCIP(客户端IP),目标IPVIP(负载均衡器前端地址)

2:负载均衡器收到报文后,发现请求的是在规则里面存在的地址,那么它就将请求报文的目标IP改为后端服务器的RIP地址并将报文根据算法发送出去。

3:报文送达Real Server后,由于报文的目标IP是自己,所以会响应请求,并讲响应报文返还给LVS

4:然后LVS将此报文的源IP修改为本机并发送给客户端。


优点:集群中的物理服务器可以使用任何支持TCP/IP操作系统,只有负载均衡器需要一个合法的IP地址。

缺点:扩展性有限。当服务器节点(普通PC服务器)增长过多时,负载均衡器将成为整个系统的瓶颈,因为所有的请求包和应答包的流向都经过负载均衡器。当服务器节点过多时,大量的数据包都交汇在负载均衡器那,速度就会变慢!




Ⅱ:LVS-DR模型

LVS-DR.jpg

1:客户端将请求发往前端的负载均衡器,请求报文源地址是CIP,目标地址为VIP。

2:负载均衡器收到报文后,发现请求的是在规则里面存在的地址,那么它将客户端请求报文的源MAC地址改为自己DIPMAC地址,目标MAC改为RIPMAC地址,并将此包发送给RS

3RS发现请求报文中的目标MAC是自己,就会将此次报文接收下来,处理完请求报文后,将响应报文通过lo:1接口送给eth0网卡直接发送给客户端


优点:和TUN(隧道模式)一样,负载均衡器也只是分发请求,应答包通过单独的路由方法返回给客户端。与VS-TUN相比,VS-DR这种实现方式不需要隧道结构,因此可以使用大多数操作系统做为物理服务器。

缺点:(不能说缺点,只能说是不足)要求负载均衡器的网卡必须与物理网卡在一个物理段上。



Ⅲ:LVS-TUN模型


LVS-TUN.jpg

1:客户端将请求发往前端的负载均衡器,请求报文源地址为CIP,目标地址为VIP

2:负载均衡器收到报文后,发现请求是规则里面存在的地址,那么它将在客户端请求报文的首部再封装一层IP报文,将源地址改为DIP,目标地址改为RIP,并将此包发送给RS

3RS收到请求包文后,首先会拆开第一层封装,然后发现里面还有一层IP首部的目标地址是自己的lo:1接口上的VIP ,所以会处理此请求报文,并将响应报文通过lo:1接口送给eth0网卡直接送给客户端;


优点:负载均衡器只负责将请求包分发给后端节点服务器,而RS将应答包直接发给用户。所以,减少了负载均衡器的大量数据流动,负载均衡器不再是系统的瓶颈,就能处理很巨大的请求量,这种方式,一台负载均衡器能够为很多RS进行分发。而且跑在公网上就能进行不同地域的分发。

缺点:隧道模式的RS节点需要合法IP,这种方式需要所有的服务器支持”IP Tunneling”(IP Encapsulation)协议,服务器可能只局限在部分Linux系统上。


Ⅳ:LVS-FULLNAT模型:通过同时修改请求报文的源IP地址(CIP–>DIP)和目标IP地址(VIP–>RIP)进行转发;

特点:

(1)VIP是公网地址,RIP和DIP是私网地址,且通常不在同一网络中,但需要经由路由器互通;

(2)RS收到的请求报文源IP为DIP,因此响应报文将直接响应给DIP;

(3)请求和响应报文都经由Director

(4)支持端口映射; 

五:LVS集群调度算法

    根据其调度时是否考虑后端主机的当前负载,可分为静态和动态方法两类

静态方法:只根据算法进行调度,而不考虑后端主机的实际连接情况和负载情况

(1) RR : Round Robin,  轮询/轮叫/轮调

  调度器通过”轮叫”调度算法将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载

    

(2) WRR:Weight RR, 加权轮询

  调度器通过“加权轮叫”调度算法根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。

(3) DH: Destination Hashing, 目标地址哈希,一般应用在正向web代理(缓存), 负载均能内网用户对外部服务器的请求;

  根据请求的目标IP地址,作为散列键(HashKey)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。

(4) SH:Source Hash, 源地址哈希

   源地址散列”调度算法根据请求的源IP地址,作为散列键(HashKey)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空

动态方法:根据算法及各RS当前的负载状态进行调度

(1).LC:最少链接(Least Connections)

  调度器通过”最少连接”调度算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用”最小连接”调度算法可以较好地均衡负载。

(2).WLC:加权最少连接(默认采用的就是这种)(Weighted Least Connections)

  在集群系统中的服务器性能差异较大的情况下,调度器采用“加权最少链接”调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。

(3).SED:最短延迟调度(Shortest Expected Delay )

  在WLC基础上改进,Overhead = (ACTIVE+1)*256/加权,不再考虑非活动状态,把当前处于活动状态的数目+1来实现,数目最小的,接受下次请求,+1的目的是为了考虑加权的时候,非活动连接过多缺陷:当权限过大的时候,会倒置空闲服务器一直处于无连接状态。

(4).NQ永不排队/最少队列调度(Never Queue Scheduling NQ)

  无需队列。如果有台 realserver的连接数=0就直接分配过去,不需要再进行sed运算,保证不会有一个主机很空间。在SED基础上无论+几,第二次一定给下一个,保证不会有一个主机不会很空闲着,不考虑非活动连接,才用NQ,SED要考虑活动状态连接,对于DNS的UDP不需要考虑非活动连接,而httpd的处于保持状态的服务就需要考虑非活动连接给服务器的压力。

(5).LBLC:基于局部性的最少链接(locality-Based Least Connections)

  基于局部性的最少链接”调度算法是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用“最少链接”的原则选出一个可用的服务器,将请求发送到该服务器。

(6). LBLCR:带复制的基于局部性最少连接(Locality-Based Least Connections with Replication)

  带复制的基于局部性最少链接”调度算法也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。它与LBLC算法的不同之处是它要维护从一个目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组,按”最小连接”原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器;若服务器超载,则按“最小连接”原则从这个集群中选出一台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的程度。

原创文章,作者:N25_木头钟,如若转载,请注明出处:http://www.178linux.com/61462

(1)
上一篇 2016-11-29 20:40
下一篇 2016-11-29 21:36

相关推荐

  • linux文本处理三剑客-sed

    sed 是什么? sed是一种流编辑器,它是文本处理中非常中的工具,在linux中被称为linux文本处理三剑客之一,能够完美的配合正则表达式使用,功能不同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文…

    Linux干货 2017-03-15
  • 第十周 N21 总有刁民想害朕

    1、请详细描述CentOS系统的启动流程(详细到每个过程系统做了哪些事情)   加电-MBR-GRUB-/sysinit-init X 对应的服务-/etc/rc.d     MBR        读取分区表     GRUB      &…

    Linux干货 2016-09-26
  • X-Y Problem

    X-Y Problem 对于X-Y Problem的意思如下: 1)有人想解决问题X2)他觉得Y可能是解决X问题的方法3)但是他不知道Y应该怎么做4)于是他去问别人Y应该怎么做? 简而言之,没有去问怎么解决问题X,而是去问解决方案Y应该怎么去实现和操作。于是乎: 1)热心的人们帮助并告诉这个人Y应该怎么搞,但是大家都觉得Y这个方案有点怪异。2)在经过大量地讨…

    Linux干货 2016-08-15
  • 马哥教育网络班21期+第一周课程练习

    1、描述计算机的组成及其功能。 计算机由五大组件组成包括:计算器,控制器,存储,输入设备,输出设备。 运算器:做运算,且只能做二进制运算,包括算术运算和逻辑运算,如加减乘除,移位,取模。运算器的核心是加法器。 控制器:控制整个计算机部件之间协调。比如做计算,运算器先从存储器取数,运算器作运算,再回存存储器。这整个过程都由控制器做协调。  &nbsp…

    Linux干货 2016-07-12
  • 8-4 文本处理工具

    本节主要了解文本处理工具 文件查看命令:cat  tac  rev     cat [OPTION]… [FILE]…         -E:显示行结束符$    &…

    Linux干货 2016-08-07
  • httpd-2.2和httpd-2.4区别 、请求方法和响应状态码、虚拟主机、访问控制、持久链接

    第十周
    The Apache HTTP Server is a powerful, efficient, and extensible web server.
    2018/2/4 16:33

    2018-02-04

评论列表(1条)

  • 马哥教育
    马哥教育 2016-12-09 20:51

    最好列出一些应用的时注意 的关键点就更好了