MYSQL 初窥MVCC实现

一,何为MVCC

1,什么是MVCC

MVCC是一种通过多版本并发控制机制来提高并发的技术

2,MVCC解决的问题

MySQL的大多数事务型存储引擎实现的都不是简单的行级锁。

基于提升并发性能的考虑,它们一般都同时实现了多版本并发控制(MVCC)。

不仅仅是MySQL,包括Oracle,PostgreSQL等其他数据库系统也都实现了MVCC,但是各自的实现机制并不相同,因为MVCC并没有一个统一的标准。

MVCC在很多情况下避免了加锁操作,因此开销更低。大多数的MVCC都实现了非阻塞的读操作,写操作也只锁定必要的行。

3,MVCC如何实现

MVCC是通过保存数据在某个时间点的快照来实现的。也就是说,不管需要执行多长时间,每个事务看到的数据是一致的。

根据事务开始的时间不同,每个事物对同一张表,同一时刻看到的数据可能是不一样的。

不同存储引擎的MVCC实现是不同的,典型的有乐观(optimistic)并发控制和悲观(pessimistic)并发控制。

MVCC只在REPEATABLE READ和READ COMMITTED两个隔离级别下工作。其他两个隔离级别都和MVCC不兼容,因为READ UNCOMMITTED总是读取最新的数据行,而不是符合当前事务版本的数据行,而SERIALIZABLE会对所有读取到的行都加锁

二,MVCC实现原理

目前比较典型实现MVCC的引擎为InnoDB,所以我们用InnoDB的MVCC实现来解释他如何进行并发控制的

InnoDB的MVCC,是通过在每行记录后面保存两个隐藏的列来实现的,

这两个列,分别保存了这个行的创建时间,一个保存的是行的删除时间。这里存储的并不是实际的时间值,而是系统版本号(可以理解为事务的ID),

每开始一个新的事务,系统版本号就会自动递增,事务开始时刻的系统版本号会作为事务的ID.

我们在REPEATABLE READ隔离级别下来观察MVCC具体是如何进行的.

1,先创建一张表


MYSQL 初窥MVCC实现

2,假设系统的版本号从1开始.

使用INSERT

InnoDB为新插入的每一行保存当前系统版本号作为版本号.

第一个事务ID为1;


MYSQL 初窥MVCC实现

对应在数据中的表如下(后面两列是隐藏列,我们通过查询语句并看不到)


MYSQL 初窥MVCC实现

事物1


使用SELECT

InnoDB会根据以下两个条件检查每行记录:

InnoDB只会查找版本早于当前事务版本的数据行(也就是,行的系统版本号小于或等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前已经存在的,要么是事务自身插入或者修改过的.

行的删除版本要么未定义,要么大于当前事务版本号,这可以确保事务读取到的行,在事务开始之前未被删除.

只有以上同时满足的记录,才能返回作为查询结果.


使用DELETE

InnoDB会为删除的每一行保存当前系统的版本号(事务的ID)作为删除标识.

看下面的具体例子分析:

第二个事务,ID为2;


MYSQL 初窥MVCC实现

事物2

example1:假设在执行这个事务ID为2的过程中,刚执行到(1),这时,有另一个事务ID为3往这个表里插入了一条数据;

第三个事务ID为3;


MYSQL 初窥MVCC实现

事物3

这时表中的数据如下:


MYSQL 初窥MVCC实现

然后接着执行事务2中的(2),由于id=4的数据的创建时间(事务ID为3)。

执行当前事务的ID为2,而InnoDB只会查找事务ID小于等于当前事务ID的数据行,

所以id=4的数据行并不会在执行事务2中的(2)被检索出来,

在事务2中的两条select 语句检索出来的数据都只会下表:

MYSQL 初窥MVCC实现

example2:假设在执行这个事务ID为2的过程中,刚执行到(1),假设事务执行完事务3后,接着又执行了事务4;

第四个事务:


MYSQL 初窥MVCC实现

事物4

此时数据库中的表如下:

MYSQL 初窥MVCC实现

接着执行事务ID为2的事务(2)

根据SELECT 检索条件可以知道,它会检索创建时间(创建事务的ID)小于当前事务ID的行和删除时间(删除事务的ID)大于当前事务的行,而id=4的行上面已经说过,而id=1的行由于删除时间(删除事务的ID)大于当前事务的ID,所以事务2的(2)select * from yang也会把id=1的数据检索出来.所以,事务2中的两条select 语句检索出来的数据都如下:

MYSQL 初窥MVCC实现

使用UPDATE

InnoDB执行UPDATE,实际上是新插入了一行记录,并保存其创建时间为当前事务的ID,

同时保存当前事务ID到要UPDATE的行的删除时间.

example2:假设在执行完事务2的(1)后又执行,其它用户执行了事务3,4,这时,又有一个用户对这张表执行了UPDATE操作:

第5个事务:

MYSQL 初窥MVCC实现

事物5

根据update的更新原则,会生成新的一行,并在原来要修改的列的删除时间列上添加本事务ID,得到表如下:

MYSQL 初窥MVCC实现

继续执行事务2的(2),根据select 语句的检索条件,得到下表:

MYSQL 初窥MVCC实现

还是和事务2中(1)select 得到相同的结果.


MYSQL 初窥MVCC实现


分享到:


相關文章: