一、简介
MySQL Group Replication(简称MGR)是MySQL官方于2016年12月推出的一个全新的高可用与高扩展的解决方案。MGR是MySQL官方在5.7.17版本引进的一个数据库高可用与高扩展的解决方案,以插件形式提供,实现了分布式下数据的最终一致性, 它是MySQL5.7版本出现的新特性,它提供了高可用、高扩展、高可靠的MySQL集群服务。
MySQL组复制分单主模式和多主模式,mysql 的复制技术仅解决了数据同步的问题,如果 master 宕机,意味着数据库管理员需要介入,应用系统可能需要修改数据库连接地址或者重启才能实现。(这里也可以使用数据库中间件产品来避免应用系统数据库连接的问题,例如 mycat 和 atlas 等产品)。组复制在数据库层面上做到了,只要集群中大多数主机可用,则服务可用,也就是说3台服务器的集群,允许其中1台宕机。
注意: 组中server可在独立物理机运行,也可在同一台机器,同一机器采用多实例,也就是逻辑认为是独立机器; 组内每台主机,都需要先安装组复制插件.否则会导致启动失败。
二、MGR特点
- 高一致性:基于分布式paxos协议实现组复制,保证数据一致性;
- 高容错性:自动检测机制,只要不是大多数节点都宕机就可以继续工作,内置防脑裂保护机制;
- 高扩展性:节点的增加与移除会自动更新组成员信息,新节点加入后,自动从其他节点同步增量数据,直到与其他节点数据一致;
- 高灵活性:提供单主模式和多主模式,单主模式在主库宕机后能够自动选主,所有写入都在主节点进行,多主模式支持多节点写入。
三、MGR与传统复制的区别和大幅改进
2.1 传统复制 (即异步复制)
主-从复制:有一个主和不等数量的从。主节点执行的事务会异步发送给从节点,在从节点重新执行。即是在主节点执行和提交事务,然后把他们异步的发送到从节点,行复制的重新执行主节点的SQL语句,这是一个 shared-nothing 的系统,默认情况下所有 server 成员都有一个完整的数据副本。
2.2 半同步复制
它在协议中添加了一个同步步骤。 这意味着主节点在提交时需要等待从节点确认它已经接收到事务。只有这样,主节点才能继续提交操作。 半同步相对异步来说, Master会确认Slave是否接到数据,更加安全。
2.3 并行复制
并行复制:复制->广播->正式复制. 并行复制的介绍可在https://www.cnblogs.com/kevingrace/p/5569652.html 文中有介绍
2.4 组复制 (MGR)
- MGR组复制原理
组复制是一种可用于实现容错系统的技术。 复制组是一个通过消息传递相互交互的 server 集群。通信层提供了原子消息(atomic message)和完全有序信息交互等保障机制实现了基于复制协议的多主更新 复制组由多个 server成员构成,并且组中的每个 server 成员可以独立地执行事务。但所有读写(RW)事务只有在冲突检测成功后才会提交。只读(RO)事务不需要在冲突检测,可以立即提交。句话说,对于任何 RW 事务,提交操作并不是由始发 server 单向决定的,而是由组来决定是否提交。准确地说,在始发 server 上,当事务准备好提交时,该 server 会广播写入值(已改变的行)和对应的写入集(已更新的行的唯一标识符)。然后会为该事务建立一个全局的顺序。最终,这意味着所有 server 成员以相同的顺序接收同一组事务。因此,所有 server 成员以相同的顺序应用相同的更改,以确保组内一致。
-
MySQL组复制协议工作流程:
需要注意:MGR组复制是一种 share-nothing 复制方案,其中每个 server 成员都有自己的完整数据副本。
- MGR实现了基于复制协议的多主更新
- 复制组由多个 server成员构成,并且组中的每个 server 成员可以独立地执行事务。但所有读写(RW)事务只有在冲突检测成功后才会提交。只读(RO)事务不需要在冲突检测,可以立即提交。
- 换句话说,对于任何 RW 事务,提交操作并不是由始发 server 单向决定的,而是由组来决定是否提交。准确地说,在始发 server 上,当事务准备好提交时,该 server 会广播写入值(已改变的行)和对应的写入集(已更新的行的唯一标识符)。然后会为该事务建立一个全局的顺序。最终,这意味着所有 server 成员以相同的顺序接收同一组事务。因此,所有 server 成员以相同的顺序应用相同的更改,以确保组内一致。
- 组复制使您能够根据在一组 server 中复制系统的状态来创建具有冗余的容错系统。因此,只要它不是全部或多数 server 发生故障,即使有一些 server 故障,系统仍然可用,最多只是性能和可伸缩性降低,但它仍然可用。server 故障是孤立并且独立的。它们由组成员服务来监控,组成员服务依赖于分布式故障检测系统,其能够在任何 server 自愿地或由于意外停止而离开组时发出信号。
- 他们是由一个分布式恢复程序来确保当有 server 加入组时,它们会自动更新组信息到最新。并且多主更新确保了即使在单个服务器故障的情况下也不会阻止更新,不必进行 server故障转移。因此,MySQL 组复制保证数据库服务持续可用。
- 值得注意的一点是,尽管数据库服务可用,但当有一个 server 崩溃时,连接到它的客户端必须定向或故障转移到不同的 server。这不是组复制要解决的问题。连接器,负载均衡器,路由器或其他形式的中间件更适合处理这个问题。
- 总之,MGR组复制提供了高可用性,高弹性,可靠的 MySQL 服务。
2.5MGR故障检测
故障检测是提供关于哪些 server 可能已死的信息(猜测)的分布式服务。 某个 server 无响应时触发猜测,组中其余成员进行协调决定以排除给定成员。如果某个 server 与组的其余成员隔离,则它会怀疑所有其他 server 都失败了。由于无法与组达成协议(因为它无法确保仲裁成员数),其怀疑不会产生后果。当服务器以此方式与组隔离时,它无法执行任何本地事务。 在线 server 列表通常称为视图,新成员server的加入离开,无论是自愿还是被迫的离开,该组都会动态地重新规划其配置,并触发视图更新 。
2.6MGR的限制
- 存储引擎必须为Innodb,即仅支持InnoDB表,并且每张表一定要有一个主键,用于做write set的冲突检测;
- 每个表必须提供主键;
- 只支持ipv4,网络需求较高;
- 必须打开GTID特性,二进制日志格式必须设置为ROW,用于选主与write set;
- COMMIT可能会导致失败,类似于快照事务隔离级别的失败场景;
- 目前一个MGR集群组最多支持9个节点;
- 不支持外键于save point特性,无法做全局间的约束检测与部分部分回滚;
- 二进制日志binlog不支持Replication event checksums;
- 多主模式(也就是多写模式) 不支持SERIALIZABLE事务隔离级别;
- 多主模式不能完全支持级联外键约束;
- 多主模式不支持在不同节点上对同一个数据库对象并发执行DDL(在不同节点上对同一行并发进行RW事务,后发起的事务会失败);
2.7MGR组复制优势
- 弹性复制(高扩展性):server动态添加移除
- 高可用分片(高扩展性):分片实现写扩展,每个分片是一个复制组。
- 替代主从复制(高扩展性):整组写入,避免单点争用 。
- 自动化系统:自动化部署Mysql复制到已有复制协议的自动化系统。
- 故障检测与容错:自动检测,若服务faild,组内成员大多数达成认为该服务已不正常,则自动隔离。
- 组内成员会构成一个视图,组内成员主动加入或离开(主动或被动),都会更新组配置,更新视图。成员自愿离开,先更新组配置,然后采用大多数成员(不包含主动脱离的成员)意见是否确认该成员离开更新视图。如果是故障要排除,则需大多数服务确认(包括故障成员意见),然后才会更新组配置和视图。
- 最大允许即时故障数:f=(n-1)/2,多数正常则正常 。
三、组复制两种运行模式
- 在单主模式下, 组复制具有自动选主功能,每次只有一个 server成员接受更新。单写模式group内只有一台节点可写可读,其他节点只可以读。对于group的部署,需要先跑起primary节点(即那个可写可读的节点,read_only = 0)然后再跑起其他的节点,并把这些节点一一加进group。其他的节点就会自动同步primary节点上面的变化,然后将自己设置为只读模式(read_only = 1)。当primary节点意外宕机或者下线,在满足大多数节点存活的情况下,group内部发起选举,选出下一个可用的读节点,提升为primary节点。primary选举根据group内剩下存活节点的UUID按字典序升序来选择,即剩余存活的节点按UUID字典序排列,然后选择排在最前的节点作为新的primary节点。
-
在多主模式下, 所有的 server 成员都可以同时接受更新。group内的所有机器都是primary节点,同时可以进行读写操作,并且数据是最终一致的。
按照我的理解来说:
- 单主模式:比多主模式多一个选举程序,第一次引导开启集群的为主,后加入的为追随者(也可以叫从机Slave),只有住的有读写权限,别的追随者在加入组的时候自动把权限禁了。如果主的挂了,其他服务器会根据UUID和一个值(类似权重)进行重新选主。每次选主都会重新把权限禁一遍。
- 多主模式:所有服务器加入组时,读写权限全部放开,大家都可以读写,但是只能更改不同行的数据,如果后加入集群的服务器改了一行数据,那前面的服务器就不能再对这行数据进行改动了,如果改动则报事务回滚取消改动,而后加入的可以改前面加入集群改过的数据。
四、MGR部署
4.1准备环境
# 三台服务器
192.168.5.10 MGR-node1 server_id=1
192.168.5.11 MGR-node2 server_id=2
192.168.5.12 MGR-node3 server_id=3
[root@mgr-node1 ~]# cat /etc/redhat-release
CentOS Linux release 7.7.1908 (Core)
[root@mgr-node1 ~]# cat /etc/sysconfig/selinux |grep "SELINUX=disabled"
SELINUX=disabled
# 特别要注意一个关键点: 必须保证各个mysql节点的主机名不一致,并且能通过主机名找到各成员!
# 则必须要在每个节点的/etc/hosts里面做主机名绑定,否则后续将节点加入group组会失败!报错RECOVERING!!
[root@mgr-node1 ~]# cat /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.5.10 MGR-node1
192.168.5.11 MGR-node2
192.168.5.12 MGR-node3
4.2安装Mysql5.7
# 在三个mysql节点机上使用yum方式安装Mysql5.7。
[root@mgr-node1 ~]# yum-config-manager --add-repo http://mirrors.xuncetech.com/mysql-repo/yum/mysql-5.7-community.repo
[root@mgr-node1 ~]# yum install mysql mysql-devel mysql-server -y
[root@mgr-node1 ~]# mkdir /data
[root@mgr-node1 ~]# systemctl stop mysqld.service
4.3安装和配置MGR信息
4.3.1MGR-node01
节点:192.168.5.10
[root@mgr-node1 ~]# cp /etc/my.cnf /etc/my.cnf.bak
[root@mgr-node1 ~]# >/etc/my.cnf
[root@mgr-node1 ~]# vim /etc/my.cnf
[mysqld]
datadir = /data/mysql
socket = /var/run/mysqld/mysql.sock
symbolic-links = 0
log-error = /data/mysql/mysqld.log
pid-file = /var/run/mysqld/mysqld.pid
#复制框架
server_id=1
gtid_mode=ON
enforce_gtid_consistency=ON
binlog_checksum=NONE
log_bin=binlog
log_slave_updates=ON
binlog_format=ROW
master_info_repository=TABLE
relay_log_info_repository=TABLE
#组复制设置
#server必须为每个事务收集写集合,并使用XXHASH64哈希算法将其编码为散列
transaction_write_set_extraction=XXHASH64
#告知插件加入或创建组命名,UUID
loose-group_replication_group_name="9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa"
#server启动时不自启组复制,为了避免每次启动自动引导具有相同名称的第二个组,所以设置为OFF。
loose-group_replication_start_on_boot=off
#告诉插件使用IP地址,端口24901用于接收组中其他成员转入连接
loose-group_replication_local_address="192.168.5.10:24901"
#启动组server,种子server,加入组应该连接这些的ip和端口;其他server要加入组得由组成员同意
loose-group_replication_group_seeds="192.168.5.10:24901,192.168.5.11:24901,192.168.5.10:24901"
loose-group_replication_bootstrap_group=off
report_host=192.168.5.10
report_port=3306
[root@mgr-node1 ~]# firewall-cmd --zone=public --add-port=3306/tcp --permanent
[root@mgr-node1 ~]# firewall-cmd --zone=public --add-port=24901-24990/tcp --permanent
[root@mgr-node1 ~]# firewall-cmd --reload
[root@mgr-node1 ~]# systemctl start mysqld
[root@mgr-node1 ~]# systemctl enable mysqld
[root@mgr-node1 ~]# cat /data/mysql/mysqld.log |grep 'A temporary password'
2019-10-30T10:12:08.951379Z 1 [Note] A temporary password is generated for root@localhost: .CGdT/O;q4y&
# 使用上面查看的密码:.CGdT/O;q4y& 登录mysql,并重置密码为123456
[root@mgr-node1 ~]# mysql -uroot -p
mysql> set global validate_password_policy=0;
Query OK, 0 rows affected (0.00 sec)
mysql> set global validate_password_length=1;
Query OK, 0 rows affected (0.00 sec)
mysql> set password=password("123456");
Query OK, 0 rows affected, 1 warning (0.00 sec)
mysql> flush privileges;
Query OK, 0 rows affected (0.00 sec)
[root@mgr-node1 ~]# mysql -uroot -p123456
mysql> select version();
+------------+
| version() |
+------------+
| 5.7.28-log |
+------------+
1 row in set (0.00 sec)
# 配置完成后, 要一次启动数据库,安装MGR插件,设置复制账号
mysql> INSTALL PLUGIN group_replication SONAME 'group_replication.so';
Query OK, 0 rows affected (0.12 sec)
mysql> SET SQL_LOG_BIN=0;
Query OK, 0 rows affected (0.00 sec)
mysql> grant replication slave on *.* to 'repuser'@'192.168.5.%' identified by '123456';
Query OK, 0 rows affected, 1 warning (0.00 sec)
mysql> FLUSH PRIVILEGES;
Query OK, 0 rows affected (0.00 sec)
mysql> SET SQL_LOG_BIN=1;
Query OK, 0 rows affected (0.00 sec)
mysql> CHANGE MASTER TO MASTER_USER='repuser', MASTER_PASSWORD='123456' FOR CHANNEL 'group_replication_recovery';
Query OK, 0 rows affected, 2 warnings (0.02 sec)
# 启动MGR单主模式
mysql> SET GLOBAL group_replication_bootstrap_group=ON;
Query OK, 0 rows affected (0.00 sec)
mysql> START GROUP_REPLICATION;
Query OK, 0 rows affected (2.05 sec)
mysql> SET GLOBAL group_replication_bootstrap_group=OFF;
Query OK, 0 rows affected (0.00 sec)
mysql> SELECT * FROM performance_schema.replication_group_members;
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| CHANNEL_NAME | MEMBER_ID | MEMBER_HOST | MEMBER_PORT | MEMBER_STATE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| group_replication_applier | baa337ea-fafd-11e9-9b4b-000c29cea327 | 192.168.5.10 | 3306 | ONLINE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
1 row in set (0.00 sec)
4.3.2MGR-node02
节点:192.168.5.11
[root@mgr-node2 ~]# cp /etc/my.cnf /etc/my.cnf.bak
[root@mgr-node2 ~]# >/etc/my.cnf
[root@mgr-node2 ~]# vim /etc/my.cnf
[mysqld]
datadir = /data/mysql
socket = /var/run/mysqld/mysql.sock
symbolic-links = 0
log-error = /data/mysql/mysqld.log
pid-file = /var/run/mysqld/mysqld.pid
#复制框架
server_id=2
gtid_mode=ON
enforce_gtid_consistency=ON
binlog_checksum=NONE
log_bin=binlog
log_slave_updates=ON
binlog_format=ROW
master_info_repository=TABLE
relay_log_info_repository=TABLE
#组复制设置
#server必须为每个事务收集写集合,并使用XXHASH64哈希算法将其编码为散列
transaction_write_set_extraction=XXHASH64
#告知插件加入或创建组命名,UUID
loose-group_replication_group_name="9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa"
#server启动时不自启组复制,为了避免每次启动自动引导具有相同名称的第二个组,所以设置为OFF。
loose-group_replication_start_on_boot=off
#告诉插件使用IP地址,端口24901用于接收组中其他成员转入连接
loose-group_replication_local_address="192.168.5.11:24901"
#启动组server,种子server,加入组应该连接这些的ip和端口;其他server要加入组得由组成员同意
loose-group_replication_group_seeds="192.168.5.10:24901,192.168.5.11:24901,192.168.5.10:24901"
loose-group_replication_bootstrap_group=off
report_host=192.168.5.11
report_port=3306
[root@mgr-node2 ~]# firewall-cmd --zone=public --add-port=3306/tcp --permanent
[root@mgr-node2 ~]# firewall-cmd --zone=public --add-port=24901-24990/tcp --permanent
[root@mgr-node2 ~]# firewall-cmd --reload
[root@mgr-node2 ~]# systemctl start mysqld
[root@mgr-node2 ~]# systemctl enable mysqld
[root@mgr-node2 ~]# cat /data/mysql/mysqld.log |grep 'A temporary password'
2019-10-30T09:39:18.675051Z 1 [Note] A temporary password is generated for root@localhost: IsMqBTki%5AB
# 使用上面查看的密码:IsMqBTki%5AB 登录mysql,并重置密码为123456
[root@mgr-node1 ~]# mysql -uroot -p
mysql> set global validate_password_policy=0;
Query OK, 0 rows affected (0.00 sec)
mysql> set global validate_password_length=1;
Query OK, 0 rows affected (0.00 sec)
mysql> set password=password("123456");
Query OK, 0 rows affected, 1 warning (0.00 sec)
mysql> flush privileges;
Query OK, 0 rows affected (0.00 sec)
[root@mgr-node1 ~]# mysql -uroot -p123456
mysql> select version();
+------------+
| version() |
+------------+
| 5.7.28-log |
+------------+
1 row in set (0.00 sec)
# 配置完成后, 要一次启动数据库,安装MGR插件,设置复制账号
mysql> INSTALL PLUGIN group_replication SONAME 'group_replication.so';
Query OK, 0 rows affected (0.12 sec)
mysql> SET SQL_LOG_BIN=0;
Query OK, 0 rows affected (0.00 sec)
mysql> grant replication slave on *.* to 'repuser'@'192.168.5.%' identified by '123456';
Query OK, 0 rows affected, 1 warning (0.00 sec)
mysql> FLUSH PRIVILEGES;
Query OK, 0 rows affected (0.00 sec)
mysql> SET SQL_LOG_BIN=1;
Query OK, 0 rows affected (0.00 sec)
mysql> CHANGE MASTER TO MASTER_USER='repuser', MASTER_PASSWORD='123456' FOR CHANNEL 'group_replication_recovery';
Query OK, 0 rows affected, 2 warnings (0.02 sec)
# 加入MGR集群
mysql> START GROUP_REPLICATION;
ERROR 3092 (HY000): The server is not configured properly to be an active member of the group. Please see more details on error log.
# 查看日志:
2019-10-31T01:42:24.346925Z 0 [ERROR] Plugin group_replication reported: 'This member has more executed transactions than those present in the group. Local transactions: 24369dd9-faf9-11e9-8ccf-000c29f62ee3:1-2,
9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa:1 > Group transactions: 9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa:1,
baa337ea-fafd-11e9-9b4b-000c29cea327:1-2'
2019-10-31T01:42:24.347000Z 0 [ERROR] Plugin group_replication reported: 'The member contains transactions not present in the group. The member will now exit the group.'
# 解决办法:
mysql> set global group_replication_allow_local_disjoint_gtids_join=ON;
Query OK, 0 rows affected, 1 warning (0.00 sec)
# 然后再接着加入MGR集群
mysql> START GROUP_REPLICATION;
Query OK, 0 rows affected, 1 warning (6.50 sec)
mysql> SELECT * FROM performance_schema.replication_group_members;
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| CHANNEL_NAME | MEMBER_ID | MEMBER_HOST | MEMBER_PORT | MEMBER_STATE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| group_replication_applier | 24369dd9-faf9-11e9-8ccf-000c29f62ee3 | 192.168.5.11 | 3306 | ONLINE |
| group_replication_applier | baa337ea-fafd-11e9-9b4b-000c29cea327 | 192.168.5.10 | 3306 | ONLINE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
2 rows in set (0.00 sec)
4.3.3MGR-node03
节点:192.168.5.12
[root@mgr-node3 ~]# cp /etc/my.cnf /etc/my.cnf.bak
[root@mgr-node3 ~]# >/etc/my.cnf
[root@mgr-node3 ~]# vim /etc/my.cnf
[mysqld]
datadir = /data/mysql
socket = /var/run/mysqld/mysql.sock
symbolic-links = 0
log-error = /data/mysql/mysqld.log
pid-file = /var/run/mysqld/mysqld.pid
#复制框架
server_id=3
gtid_mode=ON
enforce_gtid_consistency=ON
binlog_checksum=NONE
log_bin=binlog
log_slave_updates=ON
binlog_format=ROW
master_info_repository=TABLE
relay_log_info_repository=TABLE
#组复制设置
#server必须为每个事务收集写集合,并使用XXHASH64哈希算法将其编码为散列
transaction_write_set_extraction=XXHASH64
#告知插件加入或创建组命名,UUID
loose-group_replication_group_name="9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa"
#server启动时不自启组复制,为了避免每次启动自动引导具有相同名称的第二个组,所以设置为OFF。
loose-group_replication_start_on_boot=off
#告诉插件使用IP地址,端口24901用于接收组中其他成员转入连接
loose-group_replication_local_address="192.168.5.12:24901"
#启动组server,种子server,加入组应该连接这些的ip和端口;其他server要加入组得由组成员同意
loose-group_replication_group_seeds="192.168.5.10:24901,192.168.5.11:24901,192.168.5.10:24901"
loose-group_replication_bootstrap_group=off
report_host=192.168.5.12
report_port=3306
[root@mgr-node3 ~]# firewall-cmd --zone=public --add-port=3306/tcp --permanent
[root@mgr-node3 ~]# firewall-cmd --zone=public --add-port=24901-24990/tcp --permanent
[root@mgr-node3 ~]# firewall-cmd --reload
[root@mgr-node3 ~]# systemctl start mysqld
[root@mgr-node3 ~]# systemctl enable mysqld
[root@mgr-node3 ~]# cat /data/mysql/mysqld.log |grep 'A temporary password'
2019-10-30T09:39:18.675051Z 1 [Note] A temporary password is generated for root@localhost: u>L&a,ZBd67N
# 使用上面查看的密码:u>L&a,ZBd67N 登录mysql,并重置密码为123456
[root@mgr-node1 ~]# mysql -uroot -p
mysql> set global validate_password_policy=0;
Query OK, 0 rows affected (0.00 sec)
mysql> set global validate_password_length=1;
Query OK, 0 rows affected (0.00 sec)
mysql> set password=password("123456");
Query OK, 0 rows affected, 1 warning (0.00 sec)
mysql> flush privileges;
Query OK, 0 rows affected (0.00 sec)
[root@mgr-node1 ~]# mysql -uroot -p123456
mysql> select version();
+------------+
| version() |
+------------+
| 5.7.28-log |
+------------+
1 row in set (0.00 sec)
# 配置完成后, 要一次启动数据库,安装MGR插件,设置复制账号
mysql> INSTALL PLUGIN group_replication SONAME 'group_replication.so';
Query OK, 0 rows affected (0.12 sec)
mysql> SET SQL_LOG_BIN=0;
Query OK, 0 rows affected (0.00 sec)
mysql> grant replication slave on *.* to 'repuser'@'192.168.5.%' identified by '123456';
Query OK, 0 rows affected, 1 warning (0.00 sec)
mysql> FLUSH PRIVILEGES;
Query OK, 0 rows affected (0.00 sec)
mysql> SET SQL_LOG_BIN=1;
Query OK, 0 rows affected (0.00 sec)
mysql> CHANGE MASTER TO MASTER_USER='repuser', MASTER_PASSWORD='123456' FOR CHANNEL 'group_replication_recovery';
Query OK, 0 rows affected, 2 warnings (0.02 sec)
# 加入MGR集群
mysql> START GROUP_REPLICATION;
ERROR 3092 (HY000): The server is not configured properly to be an active member of the group. Please see more details on error log.
# 查看日志:
2019-10-31T01:42:24.346925Z 0 [ERROR] Plugin group_replication reported: 'This member has more executed transactions than those present in the group. Local transactions: 24369dd9-faf9-11e9-8ccf-000c29f62ee3:1-2,
9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa:1 > Group transactions: 9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa:1,
baa337ea-fafd-11e9-9b4b-000c29cea327:1-2'
2019-10-31T01:42:24.347000Z 0 [ERROR] Plugin group_replication reported: 'The member contains transactions not present in the group. The member will now exit the group.'
# 解决办法:
mysql> set global group_replication_allow_local_disjoint_gtids_join=ON;
Query OK, 0 rows affected, 1 warning (0.00 sec)
# 然后再接着加入MGR集群
mysql> START GROUP_REPLICATION;
Query OK, 0 rows affected, 1 warning (6.50 sec)
mysql> SELECT * FROM performance_schema.replication_group_members;
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| CHANNEL_NAME | MEMBER_ID | MEMBER_HOST | MEMBER_PORT | MEMBER_STATE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| group_replication_applier | 24369dd9-faf9-11e9-8ccf-000c29f62ee3 | 192.168.5.11 | 3306 | ONLINE |
| group_replication_applier | 25eaca58-faf9-11e9-8ddb-000c29ad04ef | 192.168.5.12 | 3306 | ONLINE |
| group_replication_applier | baa337ea-fafd-11e9-9b4b-000c29cea327 | 192.168.5.10 | 3306 | ONLINE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
3 rows in set (0.00 sec)
# 我们可以通过查看MEMBER_STATE来确认节点的状态:
online 在线
offline 离线
recoving 恢复中
unreachable 不可到达,查看错误日志
error 同步发生错误,查看错误日志
# 查看一下主节点:
mysql> SELECT b.member_id, b.member_host, b.member_port FROM performance_schema.global_status a JOIN performance_schema.replication_group_members b ON a.variable_value = b.member_id WHERE a.variable_name= 'group_replication_primary_member';
+--------------------------------------+--------------+-------------+
| member_id | member_host | member_port |
+--------------------------------------+--------------+-------------+
| baa337ea-fafd-11e9-9b4b-000c29cea327 | 192.168.5.10 | 3306 |
+--------------------------------------+--------------+-------------+
1 row in set (0.00 sec)
# 我们可以看到现在主节点是192.168.5.10,GR当中所有的从节点都是默认为read_only的。我们也可以通过以下系统表来检测GR的信息:
mysql> select * from performance_schema.replication_group_member_stats\G
*************************** 1. row ***************************
CHANNEL_NAME: group_replication_applier
VIEW_ID: 15724377054721932:7
MEMBER_ID: baa337ea-fafd-11e9-9b4b-000c29cea327
COUNT_TRANSACTIONS_IN_QUEUE: 0
COUNT_TRANSACTIONS_CHECKED: 5
COUNT_CONFLICTS_DETECTED: 0
COUNT_TRANSACTIONS_ROWS_VALIDATING: 6
TRANSACTIONS_COMMITTED_ALL_MEMBERS: 9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa:1-10,
baa337ea-fafd-11e9-9b4b-000c29cea327:1-2
LAST_CONFLICT_FREE_TRANSACTION: 9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa:10
1 row in set (0.00 sec)
# 通过上面可以看出: 三个MGR节点状态为online,并且主节点为192.168.5.10,只有主节点可以写入,其他两个MGR节点只读,MGR单主模式搭建成功。
4.3.4验证MGR单主模式操作
# 1. 先在node1主库节点192.168.5.10上创建测试数据库
[root@mgr-node1 ~]# mysql -uroot -p123456
mysql> CREATE DATABASE xunce CHARACTER SET utf8 COLLATE utf8_general_ci;
Query OK, 1 row affected (0.01 sec)
mysql> use xunce;
Database changed
mysql> create table if not exists haha (id int(10) PRIMARY KEY AUTO_INCREMENT,name varchar(50) NOT NULL);
Query OK, 0 rows affected (0.01 sec)
mysql> insert into xunce.haha values(1,"lixiao"),(2,"wusong"),(3,"shaobo"),(4,"yousong");
Query OK, 4 rows affected (0.01 sec)
Records: 4 Duplicates: 0 Warnings: 0
mysql> select * from xunce.haha;
+----+---------+
| id | name |
+----+---------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 4 | yousong |
+----+---------+
4 rows in set (0.00 sec)
# 2. 登录node2从库节点192.168.5.11查看数据同步情况
[root@mgr-node2 ~]# mysql -uroot -p123456
mysql> select * from xunce.haha;
+----+---------+
| id | name |
+----+---------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 4 | yousong |
+----+---------+
4 rows in set (0.00 sec)
# 3. 登录node3从库节点192.168.5.12查看数据同步情况
[root@mgr-node3 ~]# mysql -uroot -p123456
mysql> select * from xunce.haha;
+----+---------+
| id | name |
+----+---------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 4 | yousong |
+----+---------+
4 rows in set (0.00 sec)
# 4. 然后尝试在两个从库上更新数据, 发现更新失败! 因为这是MGR单主模式, 从库只能进行读操作, 不能进行写操作!
[root@mgr-node2 ~]# mysql -uroot -p123456
mysql> select * from xunce.haha;
+----+---------+
| id | name |
+----+---------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 4 | yousong |
+----+---------+
4 rows in set (0.00 sec)
mysql> delete from xunce.haha where id>3;
ERROR 1290 (HY000): The MySQL server is running with the --super-read-only option so it cannot execute this statement
mysql> insert into xunce.haha values(11,"beijing"),(12,"shanghai"),(13,"shenzhen");
ERROR 1290 (HY000): The MySQL server is running with the --super-read-only option so it cannot execute this statement
[root@mgr-node3 ~]# mysql -uroot -p123456
mysql> select * from xunce.haha;
+----+---------+
| id | name |
+----+---------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 4 | yousong |
+----+---------+
4 rows in set (0.00 sec)
mysql> delete from xunce.haha where id>3;
ERROR 1290 (HY000): The MySQL server is running with the --super-read-only option so it cannot execute this statement
mysql> insert into xunce.haha values(11,"beijing"),(12,"shanghai"),(13,"shenzhen");
ERROR 1290 (HY000): The MySQL server is running with the --super-read-only option so it cannot execute this statement
# 5.只有在主库上才能进行写操作
[root@mgr-node1 ~]# mysql -uroot -p123456
mysql> select * from xunce.haha;
+----+---------+
| id | name |
+----+---------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 4 | yousong |
+----+---------+
4 rows in set (0.00 sec)
mysql> delete from xunce.haha where id>3;
Query OK, 1 row affected (0.00 sec)
mysql> insert into xunce.haha values(11,"beijing"),(12,"shanghai"),(13,"shenzhen");
Query OK, 3 rows affected (0.01 sec)
Records: 3 Duplicates: 0 Warnings: 0
mysql> select * from xunce.haha;
+----+----------+
| id | name |
+----+----------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 11 | beijing |
| 12 | shanghai |
| 13 | shenzhen |
+----+----------+
6 rows in set (0.00 sec)
4.4故障切换
4.4.1单主模式
# 如果主节点挂掉了, 通过选举程序会从从库节点中选择一个作为主库节点. 如下模拟故障:
# 关闭主库MGR-node1的mysqld服务
[root@mgr-node1 ~]# systemctl stop mysqld
# 接着在其他节点上查看MGR组信息. 比如在MGR-node2节点查看
[root@mgr-node2 ~]# mysql -uroot -p123456
mysql> SELECT * FROM performance_schema.replication_group_members;
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| CHANNEL_NAME | MEMBER_ID | MEMBER_HOST | MEMBER_PORT | MEMBER_STATE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| group_replication_applier | 24369dd9-faf9-11e9-8ccf-000c29f62ee3 | 192.168.5.11 | 3306 | ONLINE |
| group_replication_applier | 25eaca58-faf9-11e9-8ddb-000c29ad04ef | 192.168.5.12 | 3306 | ONLINE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
2 rows in set (0.00 sec)
# 查看一下主节点:
mysql> SELECT b.member_id, b.member_host, b.member_port FROM performance_schema.global_status a JOIN performance_schema.replication_group_members b ON a.variable_value = b.member_id WHERE a.variable_name= 'group_replication_primary_member';
+--------------------------------------+--------------+-------------+
| member_id | member_host | member_port |
+--------------------------------------+--------------+-------------+
| 24369dd9-faf9-11e9-8ccf-000c29f62ee3 | 192.168.5.11 | 3306 |
+--------------------------------------+--------------+-------------+
1 row in set (0.00 sec)
# 我们可以看到现在主节点是192.168.5.11,GR当中所有的从节点都是默认为read_only的。我们也可以通过以下系统表来检测GR的信息:
mysql> select * from performance_schema.replication_group_member_stats\G
*************************** 1. row ***************************
CHANNEL_NAME: group_replication_applier
VIEW_ID: 15724377054721932:8
MEMBER_ID: 24369dd9-faf9-11e9-8ccf-000c29f62ee3
COUNT_TRANSACTIONS_IN_QUEUE: 0
COUNT_TRANSACTIONS_CHECKED: 5
COUNT_CONFLICTS_DETECTED: 0
COUNT_TRANSACTIONS_ROWS_VALIDATING: 0
TRANSACTIONS_COMMITTED_ALL_MEMBERS: 24369dd9-faf9-11e9-8ccf-000c29f62ee3:1-2,
9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa:1-10,
baa337ea-fafd-11e9-9b4b-000c29cea327:1-2
LAST_CONFLICT_FREE_TRANSACTION: 9e8c64f6-3bc0-11e9-af19-aaaaaaaaaaaa:10
1 row in set (0.00 sec)
mysql> select * from xunce.haha;
+----+----------+
| id | name |
+----+----------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 11 | beijing |
| 12 | shanghai |
| 13 | shenzhen |
+----+----------+
6 rows in set (0.00 sec)
mysql> delete from xunce.haha where id>10;
Query OK, 3 rows affected (0.00 sec)
# 如上, 发现在之前的主库MGR-node1节点挂掉后, MGR-node2节点可以进行写操作了, 说明此时已经选举MGR-node2节点为新的主节点了那么,MGR-node3节点还是从节点, 只能读不能写
[root@mgr-node3 ~]# mysql -uroot -p123456
mysql> select * from xunce.haha;
+----+--------+
| id | name |
+----+--------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
+----+--------+
3 rows in set (0.00 sec)
mysql> insert into xunce.haha values(11,"beijing"),(12,"shanghai"),(13,"shenzhen");
ERROR 1290 (HY000): The MySQL server is running with the --super-read-only option so it cannot execute this statement
# 然后再恢复MGR-node1节点, 恢复后, 需要手动激活下该节点的组复制功能
[root@mgr-node1 ~]# systemctl start mysqld
[root@mgr-node1 ~]# mysql -uroot -p123456
mysql> START GROUP_REPLICATION;
Query OK, 0 rows affected (3.02 sec)
mysql> SELECT * FROM performance_schema.replication_group_members;
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| CHANNEL_NAME | MEMBER_ID | MEMBER_HOST | MEMBER_PORT | MEMBER_STATE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| group_replication_applier | 24369dd9-faf9-11e9-8ccf-000c29f62ee3 | 192.168.5.11 | 3306 | ONLINE |
| group_replication_applier | 25eaca58-faf9-11e9-8ddb-000c29ad04ef | 192.168.5.12 | 3306 | ONLINE |
| group_replication_applier | baa337ea-fafd-11e9-9b4b-000c29cea327 | 192.168.5.10 | 3306 | ONLINE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
3 rows in set (0.00 sec)
2 rows in set (0.00 sec)
# 查看一下主节点:
mysql> SELECT b.member_id, b.member_host, b.member_port FROM performance_schema.global_status a JOIN performance_schema.replication_group_members b ON a.variable_value = b.member_id WHERE a.variable_name= 'group_replication_primary_member';
+--------------------------------------+--------------+-------------+
| member_id | member_host | member_port |
+--------------------------------------+--------------+-------------+
| 24369dd9-faf9-11e9-8ccf-000c29f62ee3 | 192.168.5.11 | 3306 |
+--------------------------------------+--------------+-------------+
1 row in set (0.00 sec)
mysql> select * from xunce.haha;
+----+--------+
| id | name |
+----+--------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
+----+--------+
3 rows in set (0.00 sec)
mysql> insert into xunce.haha values(11,"beijing"),(12,"shanghai"),(13,"shenzhen");
ERROR 1290 (HY000): The MySQL server is running with the --super-read-only option so it cannot execute this statement
# 发现MGR-node1节点恢复后, 则变为了从库节点, 只能读不能写.
# 如果从节点挂了, 恢复后, 只需要手动激活下该节点的组复制功能("START GROUP_REPLICATION;"),
# 即可正常加入到MGR组复制集群内并自动同步其他节点数据.
4.5切换到多主模式
MGR切换模式需要重新启动组复制,因些需要在所有节点上先关闭组复制,设置 group_replication_single_primary_mode=OFF 等参数,再启动组复制。
# 1) 停止组复制(在所有MGR节点上执行):
mysql> stop group_replication;
Query OK, 0 rows affected (9.32 sec)
mysql> set global group_replication_single_primary_mode=OFF;
Query OK, 0 rows affected (0.00 sec)
mysql> set global group_replication_enforce_update_everywhere_checks=ON;
Query OK, 0 rows affected (0.00 sec)
# 2) 随便选择某个MGR节点执行 (比如这里选择在MGR-node1节点):
[root@mgr-node1 ~]# mysql -uroot -p123456
mysql> SET GLOBAL group_replication_bootstrap_group=ON;
Query OK, 0 rows affected (0.00 sec)
mysql> START GROUP_REPLICATION;
Query OK, 0 rows affected (2.01 sec)
mysql> SET GLOBAL group_replication_bootstrap_group=OFF;
Query OK, 0 rows affected (0.00 sec)
# 3) 然后在其他的MGR节点执行 (这里指MGR-node2和MGR-node3节点上执行):
mysql> START GROUP_REPLICATION;
Query OK, 0 rows affected, 1 warning (3.04 sec)
# 4) 查看MGR组信息 (在任意一个MGR节点上都可以查看)
mysql> SELECT * FROM performance_schema.replication_group_members;
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| CHANNEL_NAME | MEMBER_ID | MEMBER_HOST | MEMBER_PORT | MEMBER_STATE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
| group_replication_applier | 24369dd9-faf9-11e9-8ccf-000c29f62ee3 | 192.168.5.11 | 3306 | ONLINE |
| group_replication_applier | 25eaca58-faf9-11e9-8ddb-000c29ad04ef | 192.168.5.12 | 3306 | ONLINE |
| group_replication_applier | baa337ea-fafd-11e9-9b4b-000c29cea327 | 192.168.5.10 | 3306 | ONLINE |
+---------------------------+--------------------------------------+--------------+-------------+--------------+
3 rows in set (0.00 sec)
# 可以看到所有MGR节点状态都是online,角色都是PRIMARY,MGR多主模式搭建成功。
# =========================================
# 验证下MGR多主模式的节点数据同步:
# 在MGR-node1节点更新数据:
[root@mgr-node1 ~]# mysql -uroot -p123456
mysql> select * from xunce.haha;
+----+--------+
| id | name |
+----+--------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
+----+--------+
3 rows in set (0.00 sec)
mysql> insert into xunce.haha values(11,"beijing"),(12,"shanghai"),(13,"shenzhen");
Query OK, 3 rows affected (0.00 sec)
Records: 3 Duplicates: 0 Warnings: 0
mysql> select * from xunce.haha;
+----+----------+
| id | name |
+----+----------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 11 | beijing |
| 12 | shanghai |
| 13 | shenzhen |
+----+----------+
6 rows in set (0.00 sec)
# 在MGR-node2节点更新数据
[root@mgr-node2 ~]# mysql -uroot -p123456
mysql> select * from xunce.haha;
+----+----------+
| id | name |
+----+----------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 11 | beijing |
| 12 | shanghai |
| 13 | shenzhen |
+----+----------+
6 rows in set (0.00 sec)
mysql> delete from xunce.haha where id>10;
Query OK, 3 rows affected (0.00 sec)
mysql> select * from xunce.haha;
+----+--------+
| id | name |
+----+--------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
+----+--------+
3 rows in set (0.00 sec)
在MGR-node3节点更新数据
[root@mgr-node3 ~]# mysql -uroot -p123456
mysql> select * from xunce.haha;
+----+--------+
| id | name |
+----+--------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
+----+--------+
3 rows in set (0.00 sec)
mysql> insert into xunce.haha values(11,"beijing"),(12,"shanghai"),(13,"shenzhen");
Query OK, 3 rows affected (0.00 sec)
Records: 3 Duplicates: 0 Warnings: 0
mysql> select * from xunce.haha;
+----+----------+
| id | name |
+----+----------+
| 1 | lixiao |
| 2 | wusong |
| 3 | shaobo |
| 11 | beijing |
| 12 | shanghai |
| 13 | shenzhen |
+----+----------+
6 rows in set (0.00 sec)
# 如上, MGR多主模式下, 所有节点都可以进行读写操作.
# 5) 多主模式故障切换
# 如果某个节点挂了, 则其他的节点继续进行同步.
# 当故障节点恢复后, 只需要手动激活下该节点的组复制功能("START GROUP_REPLICATION;"),
# 即可正常加入到MGR组复制集群内并自动同步其他节点数据.
4.6基于Mysql8.0
- 基于Mysql8.0, 安装MGR 单主/多主模式的集群环境
上面案例是基于Mysql5.7版本的操作记录, 如果换成Mysql8.0版本, 则稍微有些地方不一样.
Mysql8.0版本按照上面的操作, 在实操中没有出现报错.
查看组信息, 会显示主从角色: PRIMARY 和 SECONDARY
单主模式
mysql> SELECT * FROM performance_schema.replication_group_members;
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+
| CHANNEL_NAME | MEMBER_ID | MEMBER_HOST | MEMBER_PORT | MEMBER_STATE | MEMBER_ROLE | MEMBER_VERSION |
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+
| group_replication_applier | 9d9e69cb-3fb2-11e9-9420-005056ac6820 | 192.168.5.10 | 3306 | ONLINE | PRIMARY | 8.0.15 |
| group_replication_applier | a5edb094-3fb2-11e9-9ddf-00505688047c | 192.168.5.11 | 3306 | ONLINE | SECONDARY | 8.0.15 |
| group_replication_applier | a8e04386-3fb2-11e9-9eb3-005056880888 | 192.168.5.12 | 3306 | ONLINE | SECONDARY | 8.0.15 |
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+
3 rows in set (0.00 sec)
多主模式
mysql> SELECT * FROM performance_schema.replication_group_members;
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+
| CHANNEL_NAME | MEMBER_ID | MEMBER_HOST | MEMBER_PORT | MEMBER_STATE | MEMBER_ROLE | MEMBER_VERSION |
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+
| group_replication_applier | 9d9e69cb-3fb2-11e9-9420-005056ac6820 | 192.168.5.10 | 3306 | ONLINE | PRIMARY | 8.0.15 |
| group_replication_applier | a5edb094-3fb2-11e9-9ddf-00505688047c | 192.168.5.11 | 3306 | ONLINE | PRIMARY | 8.0.15 |
| group_replication_applier | a8e04386-3fb2-11e9-9eb3-005056880888 | 192.168.5.12 | 3306 | ONLINE | PRIMARY | 8.0.15 |
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+
3 rows in set (0.00 sec)
如果节点发生故障, 在恢复后需要重新加入到MGR集群里, 正确的做法是:
先stop组复制, 然后再start组复制! 不然可能会造成加入到集群后的状态是"RECOVERING"!
正确的做法:
mysql> stop GROUP_REPLICATION;
Query OK, 0 rows affected (8.18 sec)
mysql> START GROUP_REPLICATION;
Query OK, 0 rows affected (4.16 sec)
- 设置MGR组集群的白名单网段: 添加节点所在网段
或者出现报错: '[GCS] The member is leaving a group without being on one.'
这是因为没有设置白名单网段:需要添加节点自己所在网段.
在任意一个MGR节点上执行:
[root@MGR-node1 ~]# mysql -p123456
.................
# 添加白名单网段
mysql> stop group_replication;
Query OK, 0 rows affected (9.41 sec)
mysql> set global group_replication_ip_whitelist="127.0.0.1/32,192.168.0.0/24,192.168.1.0/24,192.168.5.0/24";
Query OK, 0 rows affected (0.00 sec)
mysql> start group_replication;
Query OK, 0 rows affected (3.37 sec)
mysql> show variables like "group_replication_ip_whitelist";
+--------------------------------+-----------------------------------------------------------+
| Variable_name | Value |
+--------------------------------+-----------------------------------------------------------+
| group_replication_ip_whitelist | 127.0.0.1/32,192.168.0.0/24,192.168.1.0/24,192.168.5.0/24 |
+--------------------------------+-----------------------------------------------------------+
1 row in set (0.01 sec)
group_replication_ip_whitelist = <ip,net,...>
表示设置白名单,若不配置默认为AUTOMATIC,自动识别本机网口的私网地址和私网网段,127.0.0.1 连接请求始终被允许,
一定要注意: 配置白名单前面一定要先关闭 Group Replication, 及先要执行"stop group_replication;"
也可以在/etc/my.cnf文件里配置白名单信息.
留言