目录
1.MVCC多版本并发控制的一些基本概念
当前读:该取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对该取的记录进行加锁。对于我们日常的操作,如:select...lock in share mode(共享锁), select...for update,update,insert. delete(排他锁)都是一种当前读。
快照读:简单的select(不加锁)就是快照读,快照读读取的是记录数据的可见版本,有可能是历史数据,不加锁,是非阻塞读。正常select语句就是一个快照读,
- read committed:每次select,都生成一个快照读。
- repeatable read:开启事务后第一个select语句才是快照读的地方。
- serializable:快照读会退化为当前读。
MVCC:全称multi-versioncurency contol,多版本井发控制,指推护一个数据的多个版本,使得读写提作没有冲突,快照读为MySQL实现。MVCC提供了一个非阻塞读功能。MVCC的具体实现,还需要依赖于数据库记录中的三个隐式字段,undolog日志,readview。
MVCC实现原理
记录中的隐藏字段
DB_TRX_ID:最近修改事务id,记录插入这条记录或者最后一次修改记录的事务id
DB_ROLL_PTR:回滚指针,指向这条记录的上一个版本,用于配合undo log,指向上一个版本
DB_ROW_ID:隐藏主键,如果表结构没有指定主键,将会生成该隐藏字段。
undo log
回滚日志,在insert,update,delete的时候产生的便于数据回滚的日志。记录数据回滚之前是什么样的
insert:产生的undo log日志在回滚时需要,在事务提交后,可被立即删除。
undate,delete:产生undo log日志不仅在回滚时需要,在快照读时也需要,不会被立即删除
undo log 版本链
1.首先事务2去执行sql语句之前InnoDB引擎会在undo log日志里记录数据回滚前是什么样的
再去修改数据,DB_TRX_ID会修改为当前事务id,DB_ROLL_PTR会指向回滚日志
2.事务3去修改数据首先会在undo log 日志记录当前数据,再去修改数据DB_TRX_ID修改为3,DB_ROLL_PTR指向当前日志记录,当前日志记录指向前一次记录形成一个版本链
所以undo log版本链指的是:不用事务或者相同事务对同一条记录进行修改,导致该记录的undolog生成一条记录版本链表,链表头部是最最新的旧纪录,链表尾部是最早的旧纪录。
那我们应该选择哪一个版本呢在事务回滚的时候?
ReadView
ReadView(读视图)是快照读SQL执行时MVCC提取数据的依据,记录并维护系统当前活跃的事务(未提交的)id
ReadView包含了四个核心字段:
不同的隔离级别,生成ReadView的时机不同:
read committed:在事务中每一次执行快照读时生成readview.
repeatableread:仅在事务中第一次执行快照读时生成readview,后续复用该readview.
数据访问规则
- 1.trx_id(当前事务id)==cteator_trx_id(创建快照版本的事务id)?可以访问该版本-> 成立,说明数据时当前这个事务更改的
- 2.trx_id<mix_trx_id(最小活动事务id,最先开启事务还没有提交事务id)?可以访问该版本-> 成立,说明数据已经提交了
- 3.trx_id > max_trx_id?不可以访问该版本-> 成立,说明该事务是在readview生成后才开启。
- 4.min_trx_id <= trx_id <= max_trx_id?如果trx_id不在m_ids中是可以访问该版本的-> 说
- 明数据已经提交
具体实现逻辑
1.m_ids:{3,4,5}由图可知,事务2commited了还有3,4,5没有提交
2.min_trx_id:3 事务3是还没有提交事务的最早开启事务的
3.max_trx_id:6 预先分配事务,下一个事务为6
4.creator_trx_id:5创建readview的为事务5
在RC(read commited)隔离级别下查找快照读版本逻辑
1.当前记录DB_TRX_ID = 4根据数据访问规则去匹配,发现这四条规则一体条都匹配不上,选择去undo log版本链找第二条记录
2.第二条记录当前操作事务id=3,也就是DB_TRX_ID = 3根据数据访问规则去匹配发现这四条规则也一样一条匹配不上,选择去undo log 版本链找第三条记录操作事务id = 2
3.第三条记录当前操作事务id = 2,根据数据数据访问规则去匹配,发现 trx_id < min _ trx_id匹配上了说明这次快照读找的版本是这条记录id = 2,直接把这个版本记录直接返回
在RR(repeatatable)事务隔离级别下,仅在事务中第一次执行快照读时生成ReadView,后续复用该ReadView
在第二次快照读的时候不会生成快照读,复用上面readview,可重复读
两个readview都一样,匹配规则肯定一样,查找出来的数据也是一模一样,这就保证了可重复读
总结
MVCC作用主要我们在快照读的时候来决定我们提取的到底是哪个版本
MVCC实际上实现原理是3部分,隐藏字段,Undo log ,Read View
隐藏字段:主要取决于事务id,和回滚指针
undo log 版本链
Read View读视图
MVCC + 锁保证了事务当中的隔离性,一致性:指的是数据执行前和执行之后是一致的,如果事务执行失败全部回滚保证数据执行前后一致,一致性由 redo log 和undo log 保证的