快速部署MySQL高可用方案:heartbeat + drbd + mysql

实验环境:

VIP:192.168.198.200

data1-1:

       eth0192.168.198.140  #用于外网管理IP

       eth110.0.0.7   #传递心跳信息,drbd数据同步。

data1-2:

       eth0192.168.198.150

       eth110.0.0.8    

1heartbeat安装配置

准备:两节点都执行

yum install epel* -y
yum install -y heartbeat
ntpdate 202.120.2.101

1.1配置IP

#双节点
iptables -I INPUT -s 192.168.198.0/24 -j ACCEPT   #来自内网的请求全部接受。
iptables -I INPUT -s 10.0.0.0/24 -j ACCEPT
#data1-1
ifconfig eth1 10.0.0.7/24 up
route add -host 10.0.0.8 dev eth1
#data1-2
ifconfig eth1 10.0.0.8/24 up
route add -host 10.0.0.7 dev eth1
#永久有效可以修改ifcfg-eth1文件

1.2修改主机名

#双节点

cat >> /etc/hosts <<EOF
10.0.0.7 data1-1
10.0.0.8 data1-2
EOF
#data1-1
hostname data1-1
sed -i "/^H/d" /etc/sysconfig/network
sed -i "/^/a\HOSTNAME=data1-1" /etc/sysconfig/network
 #data1-2
hostname data1-2
sed -i "/^H/d" /etc/sysconfig/network
sed -i "/^/a\HOSTNAME=data1-2" /etc/sysconfig/network

1.3提供相同的配置文件

#data1-1
#cd /usr/share/doc/heartbeat-3.0.4/
#cp ha.cf haresources authkeys /etc/ha.d/  #把文件复制过去。
cd /etc/ha.d

vim authkeys   #编辑认证文件
auth 1
1 sha1 HI!
chmod 600 authkeys

vim ha.cf   #配置文件
debugfile /var/log/ha-debug
logfile     /var/log/ha-log
logfacility       local0
keepalive 2
deadtime 30
warntime 10
initdead 120
udpport   694
mcast eth1 225.0.100.2 694 1 0
auto_failback on
watchdog /dev/watchdog
node       data1-1
node       data1-2
crm off

vim haresources   #资源文件
data1-1 IPaddr::192.168.198.200/24/eth0
scp /etc/ha.d/{authkeys,haresources,ha.cf} data1-2:/etc/ha.d/    #双方提供相同的配置文件

2drbd安装配置

#下面都是在两台节点执行相同的操作
yum groupinstall -y "Development tools"  #可选
yum install -y kernel kernel-devel kernel-headers  #后期内核版本和drbd不兼容问题,可选,安装好之后不要忘记重启。
vim /etc/drbd.conf    #编辑drbd配置文件
global {
       usage-count no;
}
common {
       syncer {
#            rate 10M;
              verify-alg crc32c;
       }
}
resource data {
       protocol C;
       disk {
              on-io-error detach;
       }
       on data1-1 {
              device /dev/drbd0;
              disk /dev/sda5; 
              address 10.0.0.7:7788;
              meta-disk /dev/sda6;
       }
       on data1-2 {
              device /dev/drbd0;
              disk /dev/sda5;
              address 10.0.0.8:7788;
              meta-disk /dev/sda6;
       }
}

提前对磁盘做好分区。

#两节点
mkfs.ext4 /dev/sda5
drbdadm create-md data
mkdir -p  /usr/local/var/run/drbd
drbdadm up data

在data1-1上面:
drbdadm -- --overwrite-data-of-peer primary data
mkdir /data
mount /dev/drbd0 /data/
cat /proc/drbd #查看同步信息
vim /etc/ha.d/haresources
data1-1 IPaddr::192.168.198.200/24/eth0 drbddisk::data Filesystem::/dev/drbd0::/data::ext4

scp /etc/ha.d/haresources data1-2:/etc/ha.d/

重启heartbeat测试

3、安装配置mysql

#两边节点操作
groupadd mysql
useradd -g mysql mysql

#主节点data1-1操作
mkdir -pv /data/3306/{data,binlog}
chown -R mysql.mysql /data/
cd /usr/local/src/
wget http://dev.mysql.com/get/Downloads/MySQL-5.5/mysql-5.5.45.tar.gz
tar -xf mysql-5.5.45.tar.gz
cd mysql-5.5.45
cmake . -DCMAKE_INSTALL_PREFIX=/usr/local/mysql \
-DMYSQL_DATADIR=/data \
-DSYSCONFDIR=/etc \
-DWITH_INNOBASE_STORAGE_ENGINE=1 \
-DWITH_ARCHIVE_STORAGE_ENGINE=1 \
-DWITH_BLACKHOLE_STORAGE_ENGINE=1 \
-DWITH_READLINE=1 \
-DWITH_SSL=system \
-DWITH_ZLIB=system \
-DWITH_LIBWRAP=0 \
-DMYSQL_UNIX_ADDR=/tmp/mysql.sock \
-DDEFAULT_CHARSET=utf8 \
-DDEFAULT_COLLATION=utf8_general_ci
make
gmake
make install
cd /usr/local/mysql/
scripts/mysql_install_db --user=mysql --basedir=/usr/local/mysql --datadir=/data/3306/
cp support-files/my-small.cnf /data/3306/my.cf
vim /data/3306/my.cf
....
socket          = /data/3306/mysql.sock
 ....
datadir=/data/3306/data
server-id       = 3306
log-bin=/data/3306/binlog/mysql-bin
binlog_format=mixed
log-error=/data/3306/data/mysql-err
vim /data/3306/mysql.sh   #提供启动脚本
#!/bin/bash
#
MYSQL=/usr/local/mysql/bin
PORT=3306
DEFAULTSFILE=/data/$PORT/my.cf
CMD=shutdown
SOCKET=/data/${PORT}/mysql.sock
start_mysql () {
       echo "Starting MySQL.."
       ${MYSQL}/mysqld_safe --defaults-file=${DEFAULTSFILE} &
}
 
stop_mysql () {
       echo "Stopping MySQL.."
       ${MYSQL}/mysqladmin -S $SOCKET $CMD
}
 
case $1 in
start)
       start_mysql
       ;;
stop)
       stop_mysql
       ;;
restart)
       stop_mysql
       sleep 2
       start_mysql    
       ;;
*)
       echo "Usage:`basename $0` {start|stop}"
esac
chmod +x /data/3306/mysql.sh
mv /data/3306/mysql.sh /data/3306/mysql
cp mysql /etc/ha.d/resource.d/   #提供mysql资源文件
vim /etc/ha.d/haresources
data1-1 IPaddr::192.168.198.200/24/eth0 drbddisk::data Filesystem::/dev/drbd0::/data::ext4 mysql
scp -r /etc/ha.d/ data1-2:/etc/

4、测试,查看输出信息是否正确

ip addr show    #查看VIP
cat /proc/drbd   #查看drbd状态
ss -tnl | grep 330   #查看mysql是否启动

5、总结

    1、为什么叫快速部署方案呢?因为下次再次部署这个方案的时候,直接复制粘贴过去就可以了。

    2、在mysql上可以在增加从库,实现主从同步,参考 http://www.178linux.com/8496

    3、这个方案还有很多需要完善的地方。

附录:

关于裂脑

导致裂脑的原因

       1、高可用服务器之间心跳链路故障,导致无法通信。

              网线直连为例: 断线,老鼠咬了,老化了,网卡坏了,驱动坏了。IP配置及冲突问题。

              心跳线间连接的设备故障(网卡,交换机坏了)。

              仲裁的机器出问题了。

      2、高可用服务器上面开启了防火墙阻挡了心跳信息传输。

      3、高可用网卡信息配置不正确。

      4、其他服务配置不当,如心跳方式,心跳广播冲突。

防止裂脑:

       裂脑危害是非常大的。有时候可能是致命的,以后用高可用的时候,先去想想高可用的危害,做高可用是有代价的。

       以下几个方面防止裂脑的问题的发生。

       1、同时使用串行电缆和以太网电缆连接,同时用两条心跳线路。

       2、检测到裂脑时强行关闭一个心跳节点,这个功能需要特殊设备支持,stonith fence。备节点发现心跳故障,发送关机命令到主节点

       3、做好裂脑的监控报警(邮件及手机短信),在问题发生时候人为第一时间介入仲裁,降低损失,当然在实施高可用方案时,要根据业务实际需要确定是否能容忍这样的损失,对于一般的网站业务,这个损失是可控的。

       4、报警报在服务器接管之前,给人员处理留足够空间。一分钟内报警了,但是服务器此时没有接管,而是5分钟接管。数据不会丢,导致用户无法写。

       5、报警后不自动接管,而是认为人员控制接管。

       6、增加仲裁机制,确定谁该获得资源。

       6.1 列入设置参考IP,当心跳线断开时候,谁ping一下餐开IP,能够相互通信的一方就接管。ping不通的一方可以自我重启,以彻底释放资源。

       6.2 第三方软件。

裂脑发生了,影响是比较大的,尽量不让它发生。而不是已经发生再去解决。

drbd裂脑,参考:http://itindex.net/detail/50197-drbd

故障处理:

[root@data1-1 ~]# cat /proc/drbd
version: 8.4.4 (api:1/proto:86-101)
GIT-hash: 74402fecf24da8e5438171ee8c19e28627e1c98a build by root@data1-1, 2015-10-05 08:52:17
 0: cs:WFConnection ro:Secondary/Unknown ds:UpToDate/DUnknown C r-----
    ns:1057605 nr:8 dw:24 dr:1059271 al:1 bm:65 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0

在从节点执行

drbdadm connect --discard-my-data data
[root@data1-1 ~]# cat /proc/drbd
version: 8.4.4 (api:1/proto:86-101)
GIT-hash: 74402fecf24da8e5438171ee8c19e28627e1c98a build by root@data1-1, 2015-10-05 08:52:17
 0: cs:Connected ro:Secondary/Secondary ds:UpToDate/UpToDate C r-----
    ns:1057605 nr:8 dw:24 dr:1059271 al:1 bm:65 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0

原创文章,作者:艾贺,如若转载,请注明出处:http://www.178linux.com/8608