lvs的四种调度类型和调度算法介绍

lvs是linux内核级的负载均衡解决方案,作为netfilter的补充套件,其工作在INPUT hook上。

相比nginx等负载均衡解决方案的差异如下:

  • lvs工作于内核空间,不受用户空间套接字和端口数量的限制,而且所有调度工作在内核空间完成,效率更高;

  • nginx为七层负载均衡器,虽然通过stream模块也可以做到四层负载均衡,但是受到套接字数量限制,而且性能不如lvs;

此文章只讨论lvs的四种调度类型和调度算法。

一、lvs集群的类型:

在介绍lvs类型工作原理之前先引入如下概念:

  • CIP:客户端ip地址

  • RIP:后端服务器ip地址

  • VIP:lvs负载均衡器面向客户端的ip地址

  • DIP:lvs负载均衡器面向后台服务器的ip地址

  • VS:lvs负载均衡器

  • RS:后端提供服务的服务器

lvs集群分为如下4种类型:

  • lvs-nat

  • lvs-dr

  • lvs-tun

  • lvs-fullnat

分别详细介绍4种类型的工作原理:

  1. lvs-nat工作原理介绍:

    通过名字大概也可以看出来,此类型和iptables的dnat类型很相似。不过iptables的dnat只能把访问某地址的请求转发到某一台特定的服务器。而lvs-nat却可以通过调度算法把用户请求转发至后台的服务器集群中的某一台,所以lvs-nat可以理解为面向多目标的dnat。

    其工作原理如下:

    client请求vs的vip –> 数据到达INPUT链 –> 源ip保持不变,匹配lvs规则,目标ip通过调度算法变为后台某一台RS的RIP –> 后台RS发起响应报文(源地址为RIP,目的地址为DIP) –> VS把数据包发送给客户端(源地址VIP,目标地址CIP)

  2. lvs-dr工作原理介绍:

    lvs-nat存在一个问题:所有的请求和响应报文都需要经过负载均衡器做转发,这样会导致负载均衡器压力过大,而且效率不高。所以如果能够让后台服务器直接响应客户端效率会提高不少。因此诞生了lvs-dr的方式。lvs-dr会在请求报文再封装一个MAC地址首部用于同一网段通信,而且所有的RS都需要配置VIP的地址。

    所有RS都配置vip则会存在ip地址冲突,所有需要如下方法解决:

    • 在前端网关做静态地址绑定,不够灵活,不可取;

    • 通过arptable做配置,过于繁琐;

    • 通过修改linux内核参数来禁止相同ip的网卡做arp的通告和回应;

    lvs-dr的负载均衡器和后台服务器位于同一网段,其工作过程如下:

    客户端发送请求报文到负载均衡器(源ip:CIP,目标ip:vip)–> 负载均衡器在请求报文封装MAC首部,源MAC为dip,目标MAC为某一台RS,源ip和目标ip和端口都保持不变 –> RS通过本机vip地址给客户端发送响应报文。

  3. lvs-tun工作原理:

    当RS分布于不同地点的多个机房的时候lvs负载均衡器则无法完成工作的调度,所有需要lvs-tun来进行工作。

    注意:

    lvs-tun的所有RS也都需要配置VIP用于发送响应报文。

    lvs-tun是在请求报文又封装了一层ip报文用于隧道传输,工作方法如下:

    客户端发送请求到lvs负载均衡器(源ip:CIP,目标ip:VIP)–> 通过调度算法选定一台公网上的RS,然后在请求报文外再封装一层ip首部,源ip为DIP,目标IP为RIP –> RS接收到报文,拆包得到原始请求报文(源ip:CIP,目标ip:VIP),然后用本机的VIP发送响应报文到CIP完成通信。

  4. lvs-fullnat工作原理:

    lvs-fullnat不是lvs内置的一种调度机制,需要编译安装。lvs-fullnat会修改报文的源ip和目标ip,也可以用于公网通信。

    工作原理如下:

    客户端发送请求到lvs(源ip:CIP,目标ip:VIP)–> lvs根据调度机制发送报文到挑选的RS(源ip:DIP,目标IP:RIP)–> RS发送响应报文(源IP:RIP,目标IP:DIP)–> lvs转发响应报文到客户端(源IP:VIP,目标ip:CIP)–> 通信完成。

二、lvs调度算法

lvs调度算法按照是否计算后台服务器的负载分为动态方法和静态方法:

静态方法:

  • RR:轮询

  • WRR:加权轮询,根据服务器的权重去做轮询

  • SH:用于session保持,将来自同一ip的请求都发往该ip第一次请求的RS,用于保持会话;

  • DH:发送到同一目的地址的请求都发送到指定的RS服务器,常用于正向代理的缓存场景。如:一个企业有两条外网线路,每个外网线路的网关都有缓存,如果采用轮询机制通过两个网关进行网络访问,则网关缓存命中率太低,所有把发往某一指定目标ip的所有请求都发送到指定的网关则提高网关缓存命中率。

动态方法:

  • LC:最少连接,把请求发送给连接最少的服务器,公式:Overhead=activeconns*256+inactiveconns

  • WLC:加权最少连接,按照服务器权重和服务器的连接数分配连接。但是,如果两台服务器连接都为0,则按照轮询,权重高的服务器无法发挥最佳效率,公式:Overhead=(activeconns*256+inactiveconns)/weight

  • SED:最短延迟,当连接都为0的时候,优先由权重高服务器的来处理。但是如果权重相差较大,则权重低的服务器则会闲置。公式:Overhead=(activeconns+1)*256/weight

  • NQ:never queue,永不排队,如果负载一直,则到来的请求按照权重从大到小每个都分配一个负载。之后再按照SED算法进行工作。

  • LBLC:动态DH算法,新到来的未绑定的请求按照服务器负载来进行调度绑定。

  • LBLR:带复制功能的LBLC算法,即缓存复

原创文章,作者:王子豪,如若转载,请注明出处:http://www.178linux.com/78527

(1)
王子豪王子豪
上一篇 2017-06-25 18:58
下一篇 2017-06-25 21:31

相关推荐

  • DNS

    DNS DNS解析 DNS名称解析方式:名称 –> IP:正向解析IP –> 名称:反向解析注意:二者的名称空间,非为同一个空间,即非为同一棵树;因此,也不是同一个解析库; DNS查询类型:递归查询:一般是客户机和服务器之间的查询;即只发送一个请求,其他的工作交由上层服务器去解决;迭代查询:一般是服务器和服务器之间的凡是,…

    Linux干货 2017-05-31
  • Linux的启动流程

    Linux的启动流程大致上如下图. 现在详细说明一下每个步骤: 第一阶段 当系统启动时,系统首先会加载BIOS。BIOS的首先会检查各硬件设备,当检查完毕没有问题之后。BIOS会根据设定的BootSequence来寻找可以引导系统的设备。一般而言,Linux是通过磁盘上MBR来引导系统的。 第二阶段 MBR是Master Boot Record,是位于磁盘第…

    Linux干货 2016-02-28
  • Linux基础—磁盘管理

    1、创建一个10G分区、并格式化为ext4文件系统 1)要求其block大小为2048,预留空间百分比2,卷标MYDATA,默认挂载属性包含acl 2)挂载至/data/mydata目录,要求挂载时禁止程序自动运行,且不更新文件的访问时间戳 #mkfs.ext4 -b 2048 -m 2 -L my…

    Linux干货 2016-11-17
  • 用PHP编写Hadoop的MapReduce程序

    Hadoop流 虽然Hadoop是用java写的,但是Hadoop提供了Hadoop流,Hadoop流提供一个API, 允许用户使用任何语言编写map函数和reduce函数.Hadoop流动关键是,它使用UNIX标准流作为程序与Hadoop之间的接口。因此,任何程序只要可以从标准输入流中读取数据,并且可以把数据写入标准输出流中,那么就可以通过Hadoop流使…

    Linux干货 2015-04-13
  • 软raid实现raid5

    现在Linux系统有磁盘情况如下 现在从sda,sdb,sdc,sdd 分区取出10G 的空间做raid5. 第一步:建立分区 现在执行fdisk  /dev/sd* 命令分区冲这四个磁盘划分10G分区 分别是sda6,sdb1,sdc1,sdd1。 具体操作如下: 分区完之后,执行#partx -a /dev/sd*  让分区生效。具体效果如下: 分区完成…

    2017-12-06
  • 马哥教育网络班22期+第1周课程练习 忍者乱太郎喻成

    1.计算机组成:  根据冯诺依曼的计算机结构分为四大块:控制器,运算器, 存储器,输入输出设备 控制器:对其他的组件进行控制 运算器:用于处理计算工作,不控制输入和输出 储存器:用于暂时或长期存储数据 输入输出:与外界进行交互 个人延伸: 我的理解这是一个在计算机研发之前的一个理论假象, 相对现在真实的计算机体系,这个分类会比较模糊。 运算器:cp…

    Linux干货 2016-08-15