HA专题: Corosync+Pacemaker+drbd实现MySQL高可用
HA专题: Corosync+Pacemaker+drbd实现MySQL高可用大纲
[*]前言
[*]实验拓扑
[*]实验环境
[*]实验步骤
[*]安装前准备工作
[*]配置DRBD
[*]配置MySQL
[*]配置Corosync+Pacemaker
[*]测试
[*]我遇到的问题
[*]总结
前言
上篇文章我们介绍了drbd的相关原理、编译安装、简单的实现. drbd虽然可以保证数据的可靠性但是我们上次的实现还有很多的缺陷,这次我们将drbd定义为HA集群的一个资源,可以实现让多个节点自动切换drbd的主从模式并结合MySQL实现其数据的高可用
实验拓扑
实验环境
实验步骤
安装前准备工作
配置一个HA集群的前提需要配置时间同步, 双机互信, 主机名解析
由于我们以前的博文已经讲解过如何配置:可以查看HA配置准备工作
配置DRBD
过程不做说明, 看我的上篇博客HA专题: 编译安装并配置DRBD
做成DRBD的设备为/dev/sdb1, 两个节点sdb1都为10G
这里教大家一个小技巧, 使用fdisk非交互分区
1. 创建一个分区文件如下, 输入交互式分区按顺序的命令
# cat sdb
n
p
1
1
10G
w
2. 使用输入重定向, 如下即可完成
# fdisk /dev/sdb < sdb
# yum groupinstall "Development Tools" "Server Platform Development" --nogpgcheck -y
# wget http://oss.linbit.com/drbd/8.4/drbd-8.4.4.tar.gz
# tar xf drbd-8.4.4.tar.gz -C /usr/src/
# cd /usr/src/drbd-8.4.4/
# ./configure --prefix=/usr/local/drbd --sysconf=/etc/ --with-km
# make KDIR=/usr/src/kernels/2.6.32-573.el6.x86_64/
# make install
# cp drbd/drbd.ko /lib/modules/2.6.32-573.el6.x86_64/kernel/lib/
# depmod
# modprobe drbd
drbd配置文件如下, 仅供参考
# grep -v "[[:space:]]#" /etc/drbd.d/global_common.conf
global {
usage-count yes;
}
common {
handlers {
}
startup {
}
options {
}
disk {
on-io-error detach;
}
net {
cram-hmac-alg "sha1";
shared-secret "anyisalin.com";
}
syncer {
rate 1000M;
}
}
资源配置文件如下
# cat /etc/drbd.d/data.res
resource data {
device /dev/drbd0;
disk /dev/sdb1;
meta-disk internal;
on node1.anyisalin.com {
address 172.16.1.2:7789;
}
on node2.anyisalin.com {
address 172.16.1.3:7789;
}
}
node2将以上操作重复一遍后, 进行如下操作
# drbdadm create-md data #node1上操作
# drbdadm create-md data #node2上操作
# service drbd start #node1上操作
# service drbd start #node2上操作
# cat /proc/drbd#查看进度, 等待同步完成
# drbdadm primary --force data #node1设置为Primary
# mkfs.ext4 /dev/drbd0#格式化文件系统为ext4
配置MySQL
这里通过通用二进制格式进行安装
# service drbd start
# mount /dev/drbd0 /data/#挂载dbrd设备到/data下
# tar xf mysql-5.5.33-linux2.6-x86_64.tar.gz-C /usr/local/
# ln -sv mysql-5.5.33-linux2.6-x86_64/ mysql
# groupadd -r -g 3306 mysql
# useradd -g mysql -u 3306 -r mysql
# cd mysql
# ./scripts/mysql_install_db --datadir=/data/ --user=mysql
# chown mysql:mysql /data/
# cp support-files/mysql.server /etc/rc.d/init.d/mysqld
# cp support-files/my-large.cnf /etc/my.cnf
# vim /etc/my.cnf #编辑配置文件, 添加下列字段
datadir = /data
skip_name_resolve = on
innodb_file_per_table = on
测试启动
# service mysqld start
Starting MySQL..
# /usr/local/mysql/bin/mysql
mysql> GRANT ALLON *.*TO anyisalin@'%' IDENTIFIED BY 'passwd';#创建用户
Query OK, 0 rows affected (0.00 sec)
mysql> FLUSH PRIVILEGES ;
Query OK, 0 rows affected (0.00 sec)
mysql> CREATE DATABASE TESTDB; #创建测试数据库
Query OK, 1 row affected (0.00 sec)
为node2配置
# service mysqld stop#停止MySQL
Shutting down MySQL.
# umount /data/
# drbdadm secondary data #将drbd设置为从模式
同步MySQL的文件到node2上
# rsync -av mysql node2.anyisalin.com:/usr/local/
# rsync -av mysql-5.5.33-linux2.6-x86_64 node2.anyisalin.com:/usr/local/
# scp /etc/rc.d/init.d/mysqld node2.anyisalin.com:/etc/rc.d/init.d/
# scp /etc/my.cnf node2.anyisalin.com:/etc/
注意: 以下操作在node2执行
# drbdadm primary data #将drbd设置为主模式
# mkdir /data
# mount /dev/drbd0 /data#挂载
# groupadd -g 3306 -r mysql#创建MySQL用户
# useradd -u 3306 -g mysql -r mysql#创建MySQL用户
# service mysqld start#启动MySQL
Starting MySQL..
# mysql -uanyisalin -ppasswd#使用我们刚才创建的用户登录
mysql> SHOW DATABASES;#刚创建的数据库还在
+---------------------+
| Database |
+---------------------+
| information_schema|
| TESTDB |
| #mysql50#lost+found |
| mysql |
| performance_schema|
+---------------------+
5 rows in set (0.00 sec)
以上操作完成后需要关闭MySQL并卸载挂载的文件系统, 并将每个节点的drbd设置为从模式
配置Corosync+Pacemaker
安装及配置过程不做说明, 可以看我以前的文章 AnyISalIn的文章, crmsh可去SUSE官方站点下载SUSE Centos HA
# yum install corosync pacemaker crmsh -y --nogpgcheck
# cd /etc/corosync/
# corosync-keygen
# chmod 600 authkey
配置文件如下: /etc/corosync/corosync.conf
# grep -v "[[:space:]]*#" /etc/corosync/corosync.conf
compatibility: whitetank
totem {
version: 2
secauth: on
threads: 0
interface {
ringnumber: 0
bindnetaddr: 172.16.1.0
mcastaddr: 239.255.1.1
mcastport: 5405
ttl: 1
}
}
logging {
fileline: off
to_stderr: no
to_logfile: yes
logfile: /var/log/cluster/corosync.log
to_syslog: no
debug: off
timestamp: on
logger_subsys {
subsys: AMF
debug: off
}
}
service {
ver: 0
name: pacemaker
}
aisexec {
user: root
group: root
}
# yum install corosync pacemaker crmsh -y --nogpgcheck
# scp -p node1.anyisalin.com:/etc/corosync/{authkey,corosync.conf} /etc/corosync/
在两个节点上启动corosync
# service corosync start
# ssh node2.anyisalin.com -- /etc/init.d/corosync start
# crm status#查看节点状态
Last updated: Wed Apr 13 15:07:52 2016
Last change: Wed Apr 13 15:07:22 2016
Stack: classic openais (with plugin)
Current DC: node2.anyisalin.com - partition with quorum
Version: 1.1.11-97629de
2 Nodes configured, 2 expected votes
0 Resources configured
Online: [ node1.anyisalin.com node2.anyisalin.com ]
Full list of resources:
配置资源
crm(live)# configure
crm(live)configure# edit #配置如下, 仅供参考
node node1.anyisalin.com \
attributes standby=on
node node2.anyisalin.com \
attributes standby=off
primitive data_drbd ocf:linbit:drbd \
params drbd_resource=data \
op monitor role=Master interval=10s timoue=20s \
op monitor role=Slave interval=20s timeout=20s \
op start interval=0 timeout=240 \
op stop interval=0 timeout=120
primitive myip IPaddr \
params ip=172.16.1.8
primitive mysql service:mysqld
primitive mysqldatafs Filesystem \
params device="/dev/drbd0" directory="/data" fstype=ext4 \
op start interval=0 timeout=60 \
op stop interval=0 timeout=60
ms MS_data_drbd data_drbd \
meta master-max=1 master-node-max=1 clone-max=2 clone-node-max=1 notify=true
colocation myip_with_mysql inf: myip mysql
order mysql_after_mysqldatafs inf: mysqldatafs mysql
colocation mysql_with_mysqldatafs inf: mysql mysqldatafs
order mysqldatafs_afer_MS_data_drbd inf: MS_data_drbd:promote mysqldatafs:start
colocation mysqldatafs_with_MS_data_drbd inf: mysqldatafs MS_data_drbd:Master
property cib-bootstrap-options: \
dc-version=1.1.11-97629de \
cluster-infrastructure="classic openais (with plugin)" \
expected-quorum-votes=2 \
stonith-enabled=false \
last-lrm-refresh=1460541144 \
no-quorum-policy=ignore
测试
现在node1是Master
连接数据库进行测试
我们先将node1 standby
再次连接数据进行测试
查看drbd的状态
我遇到的问题
这个实验我做了很久, 遇到了很多的问题, 大部分通过自己的排查和Google都解决了, 所以特定写下来希望能够帮助大家排查错误
[*]在CentOS6.X的系统中很可能出现连接不到CIB的问题, 错误提示信息could not establish cib_ro connection: connection refused (111)
解决方法: 排除是自己的问题之后, 使用互联网上的各种软件仓库之一对pacemaker更新后并重启corosync即可解决
[*]在手动配置DRBD资源前一定配置好DBRD, 如果DRBD的配置有问题会影响整体效果
我在这里说一下我的问题, 做DRBD的之前我在node2创建分区, 分完后忘记partx -a /dev/sdb,但是很奇怪的是, DRBD竟然配置成功了,并且两个节点都能手动切换主从和挂载, 数据也没问题!!!!, 到了最后做两个节点自动切换资源的时候, 资源总是默认倾向于node1节点并且不能切换到node2, 最后才排查出来并解决
总结
这个实验真心累, 做了接近20个小时, 都快没耐心了, 还好昨晚调整好了心态, 但是今天也做了十二个小时左右, 最后得知自己因为这种小错误才失败的时候真是…. 唉大家做实验一定要好好检查错误, 实在不行就重做吧, 也不知道哪里挖了坑. HA专题应该还有两篇左右, 敬请期待
作者水平很低, 如果有错误及时指出, 如果你觉得本文写的好请点一波赞~(≧▽≦)/~
作者: AnyISaIln
感谢: MageEdu
页:
[1]