数据库主从

一.什么是数据库主从分离

主从基本原理

其实就是将数据库分为了主从库，一个主库用于写数据，多个从库完成读数据的操作，主从库之间通过某种机制进行数据的同步，是一种常见的数据库架构。
一个主从同步集群，通常被称为是一个“分组”。

主从数据库的区别
从数据库(Slave)是主数据库的备份，当主数据库(Master)变化时从数据库要更新，这些数据库软件可以设计更新周期。这是提高信息安全的手段。主从数据库服务器不在一个地理位置上，当发生意外时数据库可以保存。

(1) 基本过程
1)、Mysql的主从同步就是当master（主库）发生数据变化的时候，会实时同步到slave（从库）。
2)、主从复制可以水平扩展数据库的负载能力，容错，高可用，数据备份。

3)、不管是delete、update、insert，还是创建函数、存储过程，都是在master上，当master有操作的时候，slave会快速的接受到这些操作，从而做同步。

(2) 用途和条件
1)、mysql主从复制用途
●实时灾备，用于故障切换
●读写分离，提供查询服务
●备份，避免影响业务
2)、主从部署必要条件：
●主库开启binlog日志（设置log-bin参数）
●主从server-id不同
●从库服务器能连通主库

主从同步的粒度、原理和形式：

(1)、三种主要实现粒度
详细的主从同步主要有三种形式：statement、row、mixed
　1)、statement: 会将对数据库操作的sql语句写道binlog中
　2)、row: 会将每一条数据的变化写道binlog中。
3)、mixed: statement与row的混合。Mysql决定何时写statement格式的binlog, 何时写row格式的binlog。

(2)、主要的实现原理、具体操作、示意图

1)、在master机器上的操作：
　当master上的数据发生变化时，该事件变化会按照顺序写入bin-log中。当slave链接到master的时候，master机器会为slave开启binlog dump线程。当master的binlog发生变化的时候，bin-log dump线程会通知slave，并将相应的binlog内容发送给slave。
2)、在slave机器上操作：
　当主从同步开启的时候，slave上会创建两个线程：I\O线程。该线程连接到master机器，master机器上的binlog dump 线程会将binlog的内容发送给该I\O线程。该I/O线程接收到binlog内容后，再将内容写入到本地的relay log；sql线程。该线程读取到I/O线程写入的ralay log。并且根据relay log。并且根据relay log 的内容对slave数据库做相应的操作。
3)、MySQL主从复制原理图如下:

从库生成两个线程，一个I/O线程，一个SQL线程；
i/o线程去请求主库的binlog，并将得到的binlog日志写到relay log（中继日志）文件中；
主库会生成一个 log dump 线程，用来给从库 i/o线程传binlog；
SQL 线程，会读取relay log文件中的日志，并解析成具体操作，来实现主从的操作一致，而最终数据一致；

2)、主从形式

mysql主从复制灵活
● 一主一从
● 主主复制
● 一主多从—扩展系统读取的性能，因为读是在从库读取的；
● 多主一从—5.7开始支持
● 联级复制—

数据库分组架构解决什么问题
大多数互联网业务，往往读多写少，这时候，数据库的读会首先称为数据库的瓶颈，这时，如果我们希望能够线性的提升数据库的读性能，消除读写锁冲突从而提升数据库的写性能，那么就可以使用“分组架构”（读写分离架构）。用一句话概括，读写分离是用来解决数据库的读性能瓶颈的。

在互联网的应用场景中，常常数据量大、并发量高、高可用要求高、一致性要求高，如果使用“读写分离”，就需要注意这些问题：
1）数据库连接池要进行区分，哪些是读连接池，哪个是写连接池，研发的难度会增加；
2）为了保证高可用，读连接池要能够实现故障自动转移；
3）主从的一致性问题需要考虑。

二.主从分离设计以及主从之间的数据同步

**

在上面的模型中，Mysql-A就是主服务器，即master，Mysql-B就是从服务器，即slave。

在Mysql-A的数据库事件（例如修改数据库的sql操作语句），都会存储到日志系统A中，在相应的端口（默认3306）通过网络发送给Mysql-B。Mysql-B收到后，写入本地日志系统B，然后一条条的将数据库事件在数据库Mysql-B中完成。

日志系统A，是MYSQL的日志类型中的二进制日志，也就是专门用来保存修改数据库表的所有动作，即bin log，注意MYSQL会在执行语句之后，释放锁之前，写入二进制日志，确保事务安全。

日志系统B，不是二进制日志，由于它是从MYSQL-A的二进制日志复制过来的，并不是自己的数据库变化产生的，有点接力的感觉，称为中继日志，即relay log。

通过上面的机制，可以保证Mysql-A和Mysql-B的数据库数据一致，但是时间上肯定有延迟，即Mysql-B的数据是滞后的。因此，会出现这样的问题，Mysql-A的数据库操作是可以并发的执行的，但是Mysql-B只能从relay log中一条一条的读取执行。若Mysql-A的写操作很频繁，Mysql-B很可能就跟不上了。

主从同步复制有以下几种方式：
（1）同步复制，master的变化，必须等待slave-1,slave-2,…,slave-n完成后才能返回。

（2）异步复制，master只需要完成自己的数据库操作即可，至于slaves是否收到二进制日志，是否完成操作，不用关心。MYSQL的默认设置。

（3）半同步复制，master只保证slaves中的一个操作成功，就返回，其他slave不管。这个功能，是由google为MYSQL引入的

主从相关配置：
1.master主服务器的配置，编辑my.cnf文件

      #在[mysqld]中添加：
	   server-id=1
	   log_bin=master-bin
	   log_bin_index=master-bin.index
	   binlog_do_db=test
	   #备注：
	   #server-id 服务器唯一标识。
	   #log_bin 启动MySQL二进制日志，即数据同步语句，从数据库会一条一条的执行这些语句。
	   #binlog_do_db 指定记录二进制日志的数据库，即需要复制的数据库名，如果复制多个数据库，重复设置这个选项即可。
	   #binlog_ignore_db 指定不记录二进制日志的数据库，即不需要复制的数据库名，如果有多个数据库，重复设置这个选项即可。
	   #其中需要注意的是，binlog_do_db和binlog_ignore_db为互斥选项，一般只需要一个即可。

2.创建从服务器的用户和权限

     #进入mysql数据库
      [root@localhost mysql]# mysql -uroot -p
      Enter password:
 
       #创建从数据库的masterbackup用户和权限
          mysql> grant replication slave on *.* to masterbackup@'192.168.17.%' identified by '123456';
      #备注
      #192.168.17.%通配符，表示0-255的IP都可访问主服务器，正式环境请配置指定从服务器IP
      #若将 192.168.17.% 改为 %，则任何ip均可作为其从数据库来访问主服务器 
      #退出mysql
      mysql> exit;

3.重启mysql服务

  [root@localhost mysql]# service mysql restart
  Shutting down MySQL.... SUCCESS! 
  Starting MySQL. SUCCESS!

4.查看主服务器状态

  #进入mysql数据库
  [root@localhost mysql]# mysql -uroot -p
  Enter password:
 
 #查看主服务器状态
 mysql> show master status;
 +-------------------+----------+--------------+------------------+-------------------+
 | File              | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |
 +-------------------+----------+--------------+------------------+-------------------+
 | master-bin.000001 |      154 | test         |                  |                   |
 +-------------------+----------+--------------+------------------+-------------------+
 1 row in set (0.00 sec)

5.slave从服务器的配置

  #在[mysqld]中添加：
  server-id=2
  relay-log=slave-relay-bin
  relay-log-index=slave-relay-bin.index
  #replicate-do-db=test
  #备注：
  #server-id 服务器唯一标识，如果有多个从服务器，每个服务器的server-id不能重复，跟IP一样是唯一标识，如果你没设置server-id或者设置为0，则从服务器不会连接到主服务器。
  #relay-log 启动MySQL二进制日志，可以用来做数据备份和崩溃恢复，或主服务器挂掉了，将此从服务器作为其他从服务器的主服务器。
  #replicate-do-db 指定同步的数据库，如果复制多个数据库，重复设置这个选项即可。若在master端不指定binlog-do-db，则在slave端可用replication-do-db来过滤。
  #replicate-ignore-db 不需要同步的数据库，如果有多个数据库，重复设置这个选项即可。
  #其中需要注意的是，replicate-do-db和replicate-ignore-db为互斥选项，一般只需要一个即可。

6.重启mysql服务

  [root@localhost mysql]# service mysql restart
  Shutting down MySQL.... SUCCESS! 
  Starting MySQL. SUCCESS!

7.连接master主服务器

  #进入mysql数据库
  [root@localhost mysql]# mysql -uroot -p
  Enter password:
 
  #连接master主服务器
    mysql> change master to master_host='192.168.17.130',master_port=3306,master_user='masterbackup',master_password='123456',master_log_file='master-bin.000001',master_log_pos=154;
  #备注：
  #master_host对应主服务器的IP地址。
  #master_port对应主服务器的端口。
  #master_log_file对应show master status显示的File列：master-bin.000001。
  #master_log_pos对应show master status显示的Position列：154。

8.启动slave数据同步

    #启动slave数据同步
    mysql> start slave;
     
    #停止slave数据同步（若有需要）
    mysql> stop slave;

9.查看slave信息

   mysql> show slave status\G;

Slave_IO_Running和Slave_SQL_Running都为yes，则表示同步成功。

10.测试
（1）在主服务器上登陆mysql，且进入test数据库，创建test表，且插入一条数据

提示：这里最好用数据库管理工具（如nacicat）来操作。

#创建tb_test表
create table tb_test(ID varchar(36) primary key comment '主键ID',MEMO varchar(500) not null comment '信息');
 
#插入一条数据
insert into tb_test(ID,MEMO) values('1','one test');
 
#提交
commit;

（2）在从服务器上登陆mysql，且进入test数据库

你会发现从数据库中，也出现了tb_test表，且表中还有one test数据存在，证明同步数据成功。

11.解决错误
若在主从同步的过程中，出现其中一条语句同步失败报错了，则后面的语句也肯定不能同步成功了。例如，主库有一条数据，而从库并没有这一条数据，然而，在主库执行了删除这一条数据的操作，那么从库没有这么一条数据就肯定删除不了，从而报错了。在此时的从数据库的数据同步就失败了，因此后面的同步语句就无法继续执行。

这里提供的解决方法有两种：
（1）在从数据库中，使用SET全局sql_slave_skip_counter来跳过事件，跳过这一个错误，然后执行从下一个事件组开始。

    #在从数据库上操作
    mysql > stop slave;
    mysql > set global sql_slave_skip_counter=1;
    mysql > start slave;

（2）在从数据库中，重新连上主种操作会直接跳过中间的那些同步语句，可能会导致一些数据未同步过去的问题，但这种操作也是最后的绝招。最好就是令从数据库与主数据库的数据结构和数据都一致了之后，再来恢复主从同步的操作

    #在从数据库上操作
    mysql > stop slave;
    mysql> change master to master_host='192.168.17.130',master_port=3306,master_user='masterbackup',master_password='123456',master_log_file='master-bin.000001',master_log_pos=2050;
    mysql > start slave;
     
    #备注
    #master_log_file和master_log_pos可能会不同，需要在主数据库中show master status来查看

三.针对主从分离网络延迟导致的数据不一致处理方案

1.mysql数据库从库同步的延迟问题
相关参数：首先在服务器上执行show slave satus;可以看到很多同步的参数：

    Master_Log_File：                      SLAVE中的I/O线程当前正在读取的主服务器二进制日志文件的名称
    Read_Master_Log_Pos：        在当前的主服务器二进制日志中，SLAVE中的I/O线程已经读取的位置
    Relay_Log_File：                        SQL线程当前正在读取和执行的中继日志文件的名称
    Relay_Log_Pos：                        在当前的中继日志中，SQL线程已读取和执行的位置
    Relay_Master_Log_File：      由SQL线程执行的包含多数近期事件的主服务器二进制日志文件的名称
    Slave_IO_Running：                 I/O线程是否被启动并成功地连接到主服务器上
    Slave_SQL_Running：              SQL线程是否被启动
    Seconds_Behind_Master：     从属服务器SQL线程和从属服务器I/O线程之间的时间差距，单位以秒计。

从库同步延迟情况出现的
● show slave status显示参数Seconds_Behind_Master不为0，这个数值可能会很大
● show slave status显示参数Relay_Master_Log_File和Master_Log_File显示bin-log的编号相差很大，说明bin-log在从库上没有及时同步，所以近期执行的bin-log和当前IO线程所读的bin-log相差很大
● mysql的从库数据目录下存在大量mysql-relay-log日志，该日志同步完成之后就会被系统自动删除，存在大量日志，说明主从同步延迟很厉害

2.MySql数据库从库同步的延迟问题
1)、MySQL数据库主从同步延迟原理mysql主从同步原理：主库针对写操作，顺序写binlog，从库单线程去主库顺序读”写操作的binlog”，从库取到binlog在本地原样执行（随机写），来保证主从数据逻辑上一致。mysql的主从复制都是单线程的操作，主库对所有DDL和DML产生binlog，binlog是顺序写，所以效率很高，slave的Slave_IO_Running线程到主库取日志，效率比较高，下一步，问题来了，slave的Slave_SQL_Running线程将主库的DDL和DML操作在slave实施。DML和DDL的IO操作是随即的，不是顺序的，成本高很多，还可能可slave上的其他查询产生lock争用，由于Slave_SQL_Running也是单线程的，所以一个DDL卡主了，需要执行10分钟，那么所有之后的DDL会等待这个DDL执行完才会继续执行，这就导致了延时。有朋友会问：“主库上那个相同的DDL也需要执行10分，为什么slave会延时？”，答案是master可以并发，Slave_SQL_Running线程却不可以。

2)、MySQL数据库主从同步延迟是怎么产生的？当主库的TPS并发较高时，产生的DDL数量超过slave一个sql线程所能承受的范围，那么延时就产生了，当然还有就是可能与slave的大型query语句产生了锁等待。首要原因：数据库在业务上读写压力太大，CPU计算负荷大，网卡负荷大，硬盘随机IO太高次要原因：读写binlog带来的性能影响，网络传输延迟。

3.MySql数据库从库同步的延迟解决方案

1)、架构方面
1.业务的持久化层的实现采用分库架构，mysql服务可平行扩展，分散压力。

2.单个库读写分离，一主多从，主写从读，分散压力。这样从库压力比主库高，保护主库。

3.服务的基础架构在业务和mysql之间加入memcache或者redis的cache层。降低mysql的读压力。

4.不同业务的mysql物理上放在不同机器，分散压力。

5.使用比主库更好的硬件设备作为slave总结，mysql压力小，延迟自然会变小。

2)、硬件方面

1.采用好服务器，比如4u比2u性能明显好，2u比1u性能明显好。

2.存储用ssd或者盘阵或者san，提升随机写的性能。

3.主从间保证处在同一个交换机下面，并且是万兆环境。

总结，硬件强劲，延迟自然会变小。一句话，缩小延迟的解决方案就是花钱和花时间。

3)、mysql主从同步加速

1、sync_binlog在slave端设置为0

2、–logs-slave-updates 从服务器从主服务器接收到的更新不记入它的二进制日志。

3、直接禁用slave端的binlog

4、slave端，如果使用的存储引擎是innodb，innodb_flush_log_at_trx_commit =2

4)、从文件系统本身属性角度优化

master端修改linux、Unix文件系统中文件的etime属性，由于每当读文件时OS都会将读取操作发生的时间回写到磁盘上，对于读操作频繁的数据库文件来说这是没必要的，只会增加磁盘系统的负担影响I/O性能。可以通过设置文件系统的mount属性，组织操作系统写atime信息，在linux上的操作为：打开/etc/fstab，加上noatime参数/dev/sdb1 /data reiserfs noatime 1 2然后重新mount文件系统#mount -oremount /data

5)、同步参数调整主库是写，对数据安全性较高，比如sync_binlog=1，innodb_flush_log_at_trx_commit = 1 之类的设置是需要的而slave则不需要这么高的数据安全，完全可以讲sync_binlog设置为0或者关闭binlog，innodb_flushlog也可以设置为0来提高sql的执行效率
1、sync_binlog=1 oMySQL提供一个sync_binlog参数来控制数据库的binlog刷到磁盘上去。默认，sync_binlog=0，表示MySQL不控制binlog的刷新，由文件系统自己控制它的缓存的刷新。这时候的性能是最好的，但是风险也是最大的。一旦系统Crash，在binlog_cache中的所有binlog信息都会被丢失。

如果sync_binlog>0，表示每sync_binlog次事务提交，MySQL调用文件系统的刷新操作将缓存刷下去。最安全的就是sync_binlog=1了，表示每次事务提交，MySQL都会把binlog刷下去，是最安全但是性能损耗最大的设置。这样的话，在数据库所在的主机操作系统损坏或者突然掉电的情况下，系统才有可能丢失1个事务的数据。但是binlog虽然是顺序IO，但是设置sync_binlog=1，多个事务同时提交，同样很大的影响MySQL和IO性能。虽然可以通过group commit的补丁缓解，但是刷新的频率过高对IO的影响也非常大。

对于高并发事务的系统来说，“sync_binlog”设置为0和设置为1的系统写入性能差距可能高达5倍甚至更多。所以很多MySQL DBA设置的sync_binlog并不是最安全的1，而是2或者是0。这样牺牲一定的一致性，可以获得更高的并发和性能。默认情况下，并不是每次写入时都将binlog与硬盘同步。因此如果操作系统或机器(不仅仅是MySQL服务器)崩溃，有可能binlog中最后的语句丢失了。要想防止这种情况，你可以使用sync_binlog全局变量(1是最安全的值，但也是最慢的)，使binlog在每N次binlog写入后与硬盘同步。即使sync_binlog设置为1,出现崩溃时，也有可能表内容和binlog内容之间存在不一致性。

2、innodb_flush_log_at_trx_commit （这个很管用）抱怨Innodb比MyISAM慢 100倍？那么你大概是忘了调整这个值。默认值1的意思是每一次事务提交或事务外的指令都需要把日志写入（flush）硬盘，这是很费时的。特别是使用电池供电缓存（Battery backed up cache）时。设成2对于很多运用，特别是从MyISAM表转过来的是可以的，它的意思是不写入硬盘而是写入系统缓存。日志仍然会每秒flush到硬盘，所以你一般不会丢失超过1-2秒的更新。设成0会更快一点，但安全方面比较差，即使MySQL挂了也可能会丢失事务的数据。而值2只会在整个操作系统挂了时才可能丢数据。

3、ls(1) 命令可用来列出文件的 atime、ctime 和 mtime。

atime 文件的access time 在读取文件或者执行文件时更改的ctime 文件的create time 在写入文件，更改所有者，权限或链接设置时随inode的内容更改而更改mtime 文件的modified time 在写入文件时随文件内容的更改而更改ls -lc filename 列出文件的 ctimels -lu filename 列出文件的 atimels -l filename 列出文件的 mtimestat filename 列出atime，mtime，ctimeatime不一定在访问文件之后被修改因为：使用ext3文件系统的时候，如果在mount的时候使用了noatime参数那么就不会更新atime信息。这三个time stamp都放在 inode 中.如果mtime,atime 修改,inode 就一定会改, 既然 inode 改了,那ctime也就跟着改了.之所以在 mount option 中使用 noatime, 就是不想file system 做太多的修改, 而改善读取效能

4.MySql数据库从库同步其他问题及解决方案

1)、mysql主从复制存在的问题： ● 主库宕机后，数据可能丢失 ● 从库只有一个sql Thread，主库写压力大，复制很可能延时2)、解决方法： ● 半同步复制—解决数据丢失的问题 ● 并行复制—-解决从库复制延迟的问题
3)、半同步复制mysql semi-sync（半同步复制）半同步复制： ● 5.5集成到mysql，以插件的形式存在，需要单独安装 ● 确保事务提交后binlog至少传输到一个从库 ● 不保证从库应用完这个事务的binlog ● 性能有一定的降低，响应时间会更长 ● 网络异常或从库宕机，卡主主库，直到超时或从库恢复4)、主从复制–异步复制原理、半同步复制和并行复制原理比较

a、异步复制原理