keepalived实战之小试牛刀

keepalived是什么

keepalived是集群管理中保证集群高可用的一个服务软件，其功能类似于heartbeat，用来防止单点故障。

keepalived工作原理

keepalived是以VRRP协议为实现基础的，VRRP全称Virtual Router Redundancy Protocol，即虚拟路由冗余协议。虚拟路由冗余协议，可以认为是实现路由器高可用的协议，即将N台提供相同功能的路由器组成一个路由器组，这个组里面有一个master和多个backup，master上面有一个对外提供服务的vip（该路由器所在局域网内其他机器的默认路由为该vip），master会发组播，当backup收不到vrrp包时就认为master宕掉了，这时就需要根据VRRP的优先级来选举一个backup当master。这样的话就可以保证路由器的高可用了。 keepalived主要有三个模块，分别是core、check和vrrp。core模块为keepalived的核心，负责主进程的启动、维护以及全局配置文件的加载和解析。check负责健康检查，包括常见的各种检查方式。vrrp模块是来实现VRRP协议的。

keepalived的配置文件

keepalived只有一个配置文件keepalived.conf，里面主要包括以下几个配置区域:
global_defs 主要是配置故障发生时的通知对象以及机器标识
static_ipaddress和static_routes区域配置的是是本节点的IP和路由信息
vrrp_script用来做健康检查的，当时检查失败时会将vrrp_instance的priority减少相应的值
vrrp_instance用来定义对外提供服务的VIP区域及其相关属性
vrrp_rsync_group用来定义vrrp_intance组，使得这个组内成员动作一致

keepalived实战之-小试牛刀主备模型

实验目标：通过keepalived+lvs部署DR类型集群，实现高可用、负载均衡；主、备两台调度器均处于在线状态，当任意一台调度器宕机或出现故障时，VIP会“漂移”到另外一台服务器上，继续提供服务。

1.机器准备,做好时间同步,host解析

172.16.251.90  node1 [keepalived master]
172.16.251.91  node2 [keepalived backup]
172.16.251.92  node3 [web1 httpd rs1] 
172.16.251.94  node4 [web2 httpd rs2] 
172.16.251.95  node5 [client]

2.安装lvs和keepalived,我们在node1,node2上安装
node1:
(1).安装ipvsadm组件

yum install ipvsadm keepalived -y

(2).启动网卡间核心转发功能

sysctl -w net.ipv4.ip_forward=1
cat /proc/sys/net/ipv4/ip_forward

node2:同上

3.准备好web服务,实现web访问正常
node3:
(1).安装httpd

yum install httpd -y
echo "this is web1 test page." >/var/www/html/index.html

(2).启动httpd并测试一下子

systemctl start httpd
curl 127.0.0.1
[root@node3 ~]# curl 127.0.0.1
this is web1 test page.

node4:
(1).安装httpd

yum install httpd -y
echo "this is web2 test page." >/var/www/html/index.html

(2).启动httpd并测试一下子

systemctl start httpd
[root@node4 bin]# curl 127.0.0.1
this is web2 test page.

4.在node3,node4节点上配置vip

node3节点:
(1).配置VIP

ifconfig lo:0 172.16.50.50 netmask 255.255.255.255 broadcast 172.16.50.50 up
route add -host 172.16.50.50 dev lo:0

(2).配置rs主机参数

echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce

node4节点同上:

我们这里有个脚本可以通行配置:

cd /server/script/
vim setparam.sh

#!/bin/bash
        #
        vip=172.16.50.50
        mask='255.255.255.255'

        case $1 in
        start)
          echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
          echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
          echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
          echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce

          ifconfig lo:0 $vip netmask $mask broadcast $vip up
          route add -host $vip dev lo:0
          ;;

         stop)
          ifconfig lo:0 down
          echo 0 > /proc/sys/net/ipv4/conf/all/arp_ignore
          echo 0 > /proc/sys/net/ipv4/conf/lo/arp_ignore
          echo 0 > /proc/sys/net/ipv4/conf/all/arp_announce
          echo 0 > /proc/sys/net/ipv4/conf/lo/arp_announce
          ;;

         *) 
          echo "Usage $(basename $0) start|stop"
          exit 1
      ;;
esac

5.在node1,node2上配置keepalived脚本

vim /etc/keepalived/keepalived.conf

node1脚本如下:

! Configuration File for keepalived

global_defs {

   #故障发生时给谁发邮件通知
   notification_email {
     root@localhost
   }
   #通知邮件从哪个地址发出
   notification_email_from keepalived@localhost
   #通知邮件的smtp地址
   smtp_server 127.0.0.1
   #连接smtp服务器的超时时间
   smtp_connect_timeout 30
   #通过组播地址通告状态和优先级信息
   vrrp_mcast_group4 224.0.100.24  
}

vrrp_instance sr1 {
    #MASTER或BACKUP
    state MASTER
    #节点固有IP（非VIP）的网卡，用来发VRRP包
    interface ens33
    #取值在0-255之间，用来区分多个instance的VRRP组播
    virtual_router_id 51
    #设置优先级，选举master,取值范围1-255
    priority 100
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node1
    #认证区域，认证类型有PASS和HA（IPSEC），密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9RbiPlp
    }
    #配置要监控的网络接口，一旦接口出现故障，则转为FAULT状态；
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址（vip）
    virtual_ipaddress {
        172.16.50.50/24 dev ens33 label ens33:0
    }
}

virtual_server 172.16.50.50 80 {
    #定义延迟轮询时间（单位秒）  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时，sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}

node2脚本如下:

! Configuration File for keepalived

global_defs {

   #故障发生时给谁发邮件通知
   notification_email {
     root@localhost
   }
   #通知邮件从哪个地址发出
   notification_email_from keepalived@localhost
   #通知邮件的smtp地址
   smtp_server 127.0.0.1
   #连接smtp服务器的超时时间
   smtp_connect_timeout 30
   #通过组播地址通告状态和优先级信息
   vrrp_mcast_group4 224.0.100.24  
}

vrrp_instance sr1 {
    #MASTER或BACKUP
    state BACKUP
    #节点固有IP（非VIP）的网卡，用来发VRRP包
    interface ens33
    #取值在0-255之间，用来区分多个instance的VRRP组播
    virtual_router_id 51
    #设置优先级，选举master,取值范围1-255
    priority 96
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node2
    #认证区域，认证类型有PASS和HA（IPSEC），密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9RbiPlp
    }
    #配置要监控的网络接口，一旦接口出现故障，则转为FAULT状态；
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址（vip）
    virtual_ipaddress {
        172.16.50.50/24 dev ens33 label ens33:0
    }
}

virtual_server 172.16.50.50 80 {
    #定义延迟轮询时间（单位秒）  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    nat_mask 255.255.255.255
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时，sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}

6.测试关掉其中任何一个keepalived,都可访问curl 172.16.50.50

keepalived实战之-小试牛刀双主模型

我们刚刚做了一个主备模型,现在我们将这个主备模型稍微改造一下,我们只需要改造keepalived的配置文件即可:

１．在这之前,因为我们做的是lvs-dr模型,所以同样我们需要在node3,node4上做另外一个vip 因此在node3,node4上操作:

ifconfig lo:1 172.16.60.60 netmask 255.255.255.255 broadcast 172.16.60.60 up
route add -host 172.16.60.60 dev lo:1

我们用ifconfig可以看到两个

lo:0: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
        inet 172.16.50.50  netmask 255.255.255.255
        loop  txqueuelen 1  (Local Loopback)

lo:1: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
        inet 172.16.60.60  netmask 255.255.255.255
        loop  txqueuelen 1  (Local Loopback)

通用脚本改成如下:

#!/bin/bash

# Filename:    setvip.sh
# Revision:    1.1
# Date:        2017/06/24
# Author:      Srayban
# Email:       626612631@qq.com
# Website:     no
# Description: 设置vip

. /etc/init.d/functions


vip="172.16.50.50"
vip2="172.16.60.60"
mask="255.255.255.255"
case $1 in
start)
     echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
     echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
     echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
     echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce

     ifconfig lo:0 $vip netmask $mask broadcast $vip up
     ifconfig lo:1 $vip2 netmask $mask broadcast $vip2 up
     route add -host $vip dev lo:0
     route add -host $vip2 dev lo:1
     ;;

 stop)
     ifconfig lo:0 down
     ifconfig lo:1 down
     echo 0 > /proc/sys/net/ipv4/conf/all/arp_ignore
     echo 0 > /proc/sys/net/ipv4/conf/lo/arp_ignore
     echo 0 > /proc/sys/net/ipv4/conf/all/arp_announce
     echo 0 > /proc/sys/net/ipv4/conf/lo/arp_announce
     ;;

 *) 
     echo "Usage $(basename $0) start|stop"
     exit 1
     ;;
 esac
 action "setvip is success." true

2.在node1,node2上改造keepalived脚本

vim /etc/keepalived/keepalived.conf

node1脚本如下:

! Configuration File for keepalived

global_defs {

   #故障发生时给谁发邮件通知
   notification_email {
     root@localhost
   }
   #通知邮件从哪个地址发出
   notification_email_from keepalived@localhost
   #通知邮件的smtp地址
   smtp_server 127.0.0.1
   #连接smtp服务器的超时时间
   smtp_connect_timeout 30
   #通过组播地址通告状态和优先级信息
   vrrp_mcast_group4 224.0.100.24  
}

vrrp_instance sr1 {
    #MASTER或BACKUP
    state MASTER
    #节点固有IP（非VIP）的网卡，用来发VRRP包
    interface ens33
    #取值在0-255之间，用来区分多个instance的VRRP组播
    virtual_router_id 51
    #设置优先级，选举master,取值范围1-255
    priority 100
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node1
    #认证区域，认证类型有PASS和HA（IPSEC），密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9RbiPlp
    }
    #配置要监控的网络接口，一旦接口出现故障，则转为FAULT状态；
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址（vip）
    virtual_ipaddress {
        172.16.50.50/24 dev ens33 label ens33:0
    }
}


vrrp_instance sr2 {
    #MASTER或BACKUP
    state BACKUP
    #节点固有IP（非VIP）的网卡，用来发VRRP包
    interface ens33
    #取值在0-255之间，用来区分多个instance的VRRP组播
    virtual_router_id 61
    #设置优先级，选举master,取值范围1-255
    priority 96
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node1
    #认证区域，认证类型有PASS和HA（IPSEC），密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9ObiP0p
    }
    #配置要监控的网络接口，一旦接口出现故障，则转为FAULT状态；
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址（vip）
    virtual_ipaddress {
        172.16.60.60/24 dev ens33 label ens33:1
    }
}


virtual_server 172.16.60.60  80 {
    #定义延迟轮询时间（单位秒）  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时，sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}


virtual_server 172.16.50.50 80 {
    #定义延迟轮询时间（单位秒）  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时，sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}

node2脚本如下:

! Configuration File for keepalived

global_defs {

   #故障发生时给谁发邮件通知
   notification_email {
     root@localhost
   }
   #通知邮件从哪个地址发出
   notification_email_from keepalived@localhost
   #通知邮件的smtp地址
   smtp_server 127.0.0.1
   #连接smtp服务器的超时时间
   smtp_connect_timeout 30
   #通过组播地址通告状态和优先级信息
   vrrp_mcast_group4 224.0.100.24  
}

vrrp_instance sr1 {
    #MASTER或BACKUP
    state BACKUP
    #节点固有IP（非VIP）的网卡，用来发VRRP包
    interface ens33
    #取值在0-255之间，用来区分多个instance的VRRP组播
    virtual_router_id 51
    #设置优先级，选举master,取值范围1-255
    priority 96
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node2
    #认证区域，认证类型有PASS和HA（IPSEC），密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9RbiPlp
    }
    #配置要监控的网络接口，一旦接口出现故障，则转为FAULT状态；
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址（vip）
    virtual_ipaddress {
        172.16.50.50/24 dev ens33 label ens33:0
    }
}


vrrp_instance sr2 {
    #MASTER或BACKUP
    state MASTER
    #节点固有IP（非VIP）的网卡，用来发VRRP包
    interface ens33
    #取值在0-255之间，用来区分多个instance的VRRP组播
    virtual_router_id 61
    #设置优先级，选举master,取值范围1-255
    priority 100
    #健康查检时间间隔
    advert_int 1
    #定义 router_id
    router_id node2
    #认证区域，认证类型有PASS和HA（IPSEC），密码8位字符
    authentication {
        auth_type PASS
        auth_pass r9ObiP0p
    }
    #配置要监控的网络接口，一旦接口出现故障，则转为FAULT状态；
    track_interface {    
        ens33                        
    }
    #nopreempt #非抢占模式
    #配置虚拟IP地址（vip）
    virtual_ipaddress {
        172.16.60.60/24 dev ens33 label ens33:1
    }
}


virtual_server 172.16.60.60  80 {
    #定义延迟轮询时间（单位秒）  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    nat_mask 255.255.255.255
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时，sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}

virtual_server 172.16.50.50 80 {
    #定义延迟轮询时间（单位秒）  
    delay_loop 6
    #设定VS的调用算法
    lb_algo wrr
    #设定lvs调度类型
    lb_kind DR
    nat_mask 255.255.255.255
    persistence_timeout 50
    #工作的协议
    protocol TCP
    #当所有real server宕掉时，sorry server顶替
    sorry_server 127.0.0.1 80     

    #真正提供服务的服务器RS1
    real_server 172.16.251.92 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }

    #真正提供服务的服务器RS2
    real_server 172.16.251.94 80 {
        #权重
        weight 1

        #设置健康状态检测方法
        HTTP_GET  {
            url {

              #定义要监控的URL；
              path /

              #判断上述检测机制为健康状态的响应码；
              status_code 200
            }

            #连接请求的超时时长
            connect_timeout 3
            #重试次数
            nb_get_retry 3
            #下次重试的延迟时间
            delay_before_retry 1
        }
    }


}

3.脚本改造以后,启动keepalived

for i in {1..12};do curl 172.16.50.50; curl 172.16.60.60; done

可以看到两个都能正常访问了

原创文章，作者：srayban，如若转载，请注明出处：http://www.178linux.com/78490

keepalived实战之小试牛刀

keepalived是什么

keepalived工作原理

keepalived的配置文件

keepalived实战之-小试牛刀主备模型

keepalived实战之-小试牛刀双主模型

相关推荐

文件相关命令

shell脚本1——test测试

N22-℡浮生.若夢 ╮第九周作业

随笔

iptables基础实战练习

基于LNMP搭建wordpress个人主页