数据库事务的 ACID 特性
原子性 (Atomicity):事务内的操作要么全部成功,要么全部回滚。
一致性 (Consistency):事务执行后数据库保持逻辑完整性(约束、业务规则)。
隔离性 (Isolation):事务并发执行时互不干扰。
持久性 (Durability):事务提交后修改永久有效。
事务并发问题
在并发场景下,若隔离性不足,可能引发以下问题:
脏读 (Dirty Read):事务 A 读取了事务 B 未提交的修改。
不可重复读 (Non-Repeatable Read):事务 A 多次读取同一数据,结果不一致(因事务 B 修改了该数据并提交)。
幻读 (Phantom Read):事务 A 多次查询同一条件,结果集的行数变化(因事务 B 插入或删除了符合条件的数据并提交)。
MVCC 如何解决这些问题?
MVCC(Multi-Version Concurrency Control,多版本并发控制) 是一种通过维护数据的多个版本来实现无锁并发控制的机制。它通过以下方式解决脏读、不可重复读和幻读:
1. MVCC 的核心原理
数据版本快照:每个事务启动时,会生成一个一致性视图(Read View),记录当前活跃事务的 ID 列表。
版本链:每条数据行保存多个版本,通过 DB_TRX_ID(事务 ID)和 DB_ROLL_PTR(回滚指针)链接到历史版本。
可见性规则:事务只能看到在它启动前已提交的版本,或由自身修改的版本。
2. 解决脏读
问题场景:
事务 B 修改数据但未提交,事务 A 读取了该未提交的脏数据。
MVCC 的解决方案:
事务 A 读取数据时,根据其 Read View 判断数据版本的可见性。
若数据版本对应的事务(事务 B)未提交,则沿着版本链找到已提交的最新版本。
结果:事务 A 读取的是事务 B 修改前的已提交版本,避免脏读。
3. 解决不可重复读
问题场景:
事务 A 第一次读取数据后,事务 B 修改并提交了该数据,事务 A 再次读取时结果不一致。
MVCC 的解决方案:
在 可重复读(Repeatable Read) 隔离级别下,事务 A 的 Read View 在第一次查询时生成,后续所有读取都基于此视图。
即使事务 B 提交了新版本,事务 A 仍通过版本链读取旧版本数据。
结果:事务 A 多次读取同一数据的结果一致,避免不可重复读。
4. 解决幻读
问题场景:
事务 A 根据条件查询得到结果集,事务 B 插入或删除符合条件的数据并提交,事务 A 再次查询时结果集行数变化。
MVCC 的解决方案:
可重复读(RR)隔离级别下:
快照读(普通 SELECT):事务 A 基于一致性视图读取数据,其他事务插入的新数据对其不可见,避免幻读。
当前读(SELECT FOR UPDATE 或 UPDATE/DELETE):通过 间隙锁(Gap Lock) 锁定范围,阻止其他事务插入符合条件的数据。
读已提交(RC)隔离级别下:
MVCC 仅解决部分幻读问题,但可能因其他事务插入新数据导致幻读。
MVCC 的具体实现(以 MySQL InnoDB 为例)
1. 隐藏字段
每条记录包含以下隐藏字段:
DB_TRX_ID:最后修改该数据的事务 ID。
DB_ROLL_PTR:指向 Undo Log 中旧版本数据的指针。
DB_ROW_ID:行唯一标识(隐式主键)。
2. Undo Log
存储数据的历史版本,形成版本链。
事务回滚时,通过 Undo Log 恢复数据。
3. Read View
包含以下信息:
trx_ids:当前活跃事务 ID 列表。
low_limit_id:生成 Read View 时系统尚未分配的最小事务 ID。
up_limit_id:生成 Read View 时系统已分配的最大事务 ID。
判断数据版本可见性的规则:
若数据版本的 DB_TRX_ID < up_limit_id,说明该版本在事务启动前已提交,可见。
若 DB_TRX_ID >= low_limit_id,说明该版本在事务启动后生成,不可见。
若 DB_TRX_ID 在 trx_ids 列表中且未提交,不可见;否则可见。
MVCC 的隔离级别支持
隔离级别 | 脏读 | 不可重复读 | 幻读 | 实现机制 |
---|---|---|---|---|
读未提交 (RU) | ❌ | ❌ | ❌ | 无 MVCC,直接读最新数据 |
读已提交 (RC) | ✅ | ❌ | ❌ | 每次查询生成新 Read View |
可重复读 (RR) | ✅ | ✅ 部分 | ✅(快照读) | 事务内复用同一 Read View + 间隙锁 |
串行化 (S) | ✅ | ✅ | ✅ | 完全依赖锁机制 |
MVCC 的优缺点
优点
高并发:读操作不阻塞写操作,写操作不阻塞读操作。
避免锁竞争:通过版本链实现无锁读取,提升性能。
支持快照读:提供一致性视图,简化业务逻辑。
缺点
存储开销:需维护多版本数据和 Undo Log。
历史版本清理:需定期清理过期版本(如 MySQL 的 Purge 线程)。
无法完全消除幻读:在 RR 级别下,当前读仍需间隙锁配合。
总结
MVCC 核心:通过多版本和一致性视图实现无锁并发控制。
解决脏读:只读取已提交的版本。
解决不可重复读:事务内复用同一 Read View。
解决幻读:快照读通过版本控制,当前读通过间隙锁。
适用场景:读多写少的高并发系统(如电商、社交平台)。
通过 MVCC,数据库在保证 ACID 特性的同时,显著提升了并发性能,是现代关系型数据库(如 MySQL、PostgreSQL)的核心并发控制机制。