MySQL - 锁问题
# 简介
# 锁概述
锁是计算机协调多个进程或线程并发访问某一资源的机制(避免争抢)。
在数据库中,除传统的计算资源(如 CPU、RAM、I/O 等)的争用以外,数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题,锁冲突也是影响数据库并发访问性能的一个重要因素。从这个角度来说,锁对数据库而言显得尤其重要,也更加复杂。
# 锁分类
从对数据操作的粒度分:
表锁:操作时,会锁定整个表
行锁:操作时,会锁定当前操作行
从对数据操作的类型分:
读锁(共享锁):针对同一份数据,多个读操作可以同时进行而不会互相影响
写锁(排它锁):当前操作没有完成之前,它会阻断其他写锁和读锁
# MySQL锁
相对其他数据库而言,MySQL 的锁机制比较简单,其最显著的特点是不同的存储引擎支持不同的锁机制。
下表中罗列出了各存储引擎对锁的支持情况:
存储引擎 | 表级锁 | 行级锁 | 页面锁 |
---|---|---|---|
MyISAM | 支持 | 不支持 | 不支持 |
InnoDB | 支持 | 支持 | 不支持 |
MEMORY | 支持 | 不支持 | 不支持 |
BDB | 支持 | 不支持 | 支持 |
MySQL 这 3 种锁的特性可大致归纳如下:
锁类型 | 特点 |
---|---|
表级锁 | 偏向 MyISAM 存储引擎,开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低。 |
行级锁 | 偏向 InnoDB 存储引擎,开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度也最高。 |
页面锁 | 开销和加锁时间界于表锁和行锁之间;会出现死锁;锁定粒度界于表锁和行锁之间,并发度一般。 |
从上述特点可见,很难笼统地说哪种锁更好,只能就具体应用的特点来说哪种锁更合适。
仅从锁的角度来说:表级锁更适合于以查询为主,只有少量按索引条件更新数据的应用,如 Web 应用;而行级锁则更适合于有大量按索引条件并发更新少量不同数据,同时又有并查询的应用,如一些在线事务处理(OLTP)系统。
# MyISAM 表锁
MyISAM 存储引擎只支持表锁,这也是 MySQL 开始几个版本中唯一支持的锁类型。
# 如何加表锁
MyISAM 在执行查询语句(SELECT)前,会自动给涉及的所有表加读锁,在执行更新操作(UPDATE、DELETE、INSERT 等)前,会自动给涉及的表加写锁,这个过程并不需要用户干预,因此,用户一般不需要直接用 LOCK TABLE 命令给 MyISAM 表显式加锁。
lock table table_name read; --加读锁
lock table table_name writ; --加写锁
2
3
# 读锁案例
准备环境
create database demo_03 default charset=utf8mb4;
use demo_03;
CREATE TABLE `tb_book` (
`id` INT(11) auto_increment,
`name` VARCHAR(50) DEFAULT NULL,
`publish_time` DATE DEFAULT NULL,
`status` CHAR(1) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=myisam DEFAULT CHARSET=utf8 ;
INSERT INTO tb_book (id, name, publish_time, status) VALUES(NULL,'java编程思想','2088-08-01','1');
INSERT INTO tb_book (id, name, publish_time, status) VALUES(NULL,'solr编程思想','2088-08-08','0');
CREATE TABLE `tb_user` (
`id` INT(11) auto_increment,
`name` VARCHAR(50) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=myisam DEFAULT CHARSET=utf8 ;
INSERT INTO tb_user (id, name) VALUES(NULL,'令狐冲');
INSERT INTO tb_user (id, name) VALUES(NULL,'田伯光');
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
客户端一
加 tb_book 表的读锁
lock table tb_book read;
执行查询操作
select * from tb_book;
可以正常执行,查询出数据。
客户端二
执行查询操作
select * from tb_book;
可以正常执行,查询出数据。
客户端一
查询未锁定的表
select name from tb_seller;
客户端二
查询未锁定的表
select name from tb_seller;
可以正常查询出未锁定的表。
客户端一
执行插入操作
insert into tb_book values(null,'Mysql高级','2088-01-01','1');
执行插入,直接报错,由于当前 tb_book 获得的是读锁,不能执行更新操作。
客户端二
7)执行插入操作
insert into tb_book values(null,'Mysql高级','2088-01-01','1');
此时进入阻塞状态,当在客户端一执行释放锁指令 unlock tables 后,客户端二中的 inesrt 语句,立即执行。
总结:不管谁获取读写
# 写锁案例
客户端一
给 tb_book 表的写锁
lock table tb_book write ;
执行查询操作
select * from tb_book ;
查询操作执行成功。
执行更新操作
update tb_book set name = 'java编程思想(第二版)' where id = 1;
更新操作执行成功。
客户端二
执行查询操作
select * from tb_book ;
此时进入阻塞状态,当在客户端一中释放锁指令 unlock tables 后,客户端二中的 select 语句,立即执行。
如果客户端二执行写操作,则会报错,因为写锁已经被客户端一获取。
# 结论
锁模式的相互兼容性如表中所示:
由上表可见:
对 MyISAM 表的读操作,不会阻塞其他用户对同一表的读请求,但会阻塞对同一表的写请求
对 MyISAM 表的写操作,会都阻塞其他用户对同一表的读和写操作,但不会阻塞自己的读和写操作
简而言之,就是读锁会阻塞写,但是不会阻塞读。而写锁,则既会阻塞读,又会阻塞写。
此外,MyISAM 的读写锁调度是写优先,这也是 MyISAM 不适合做写为主的表的存储引擎的原因。因为写锁后,其他线程不能做任何操作,大量的更新会使查询很难得到锁,从而造成永远阻塞。
# 查看锁的争用情况
show open tables;
In_user:表当前被查询使用的次数。如果该数为零,则表是打开的,但是当前没有被使用。
Name_locked:表名称是否被锁定。名称锁定用于取消表或对表进行重命名等操作。
show status like 'Table_locks%';
Table_locks_immediate:指的是能够立即获得表级锁的次数,每立即获取锁,值加 1。
Table_locks_waited:指的是不能立即获取表级锁而需要等待的次数,每等待一次,该值加 1,此值高说明存在着较为严重的表级锁争用情况。
# InnoDB 行锁
# 行锁介绍
行锁特点:偏向 InnoDB 存储引擎,开销大,加锁慢;会出现死锁;锁定力度最小,发生锁冲突的概率最低,并发度也最高。
InnoDB 与 MyISAM 的最大不同有两点:一是支持事务;二是采用了行级锁。
# 背景知识
事务及其 ACID 属性
事务是由一组 SQL 语句组成的逻辑处理单元。
事务具有以下 4 个特性,简称为事务 ACID 属性。
ACID属性 | 含义 |
---|---|
原子性(Atomicity) | 事务是一个原子操作单元,其对数据的修改,要么全部成功,要么全部失败。 |
一致性(Consistent) | 在事务开始和完成时,数据都必须保持一致状态,如数据读取一致。 |
隔离性(Isolation) | 数据库系统提供一定的隔离机制,保证事务在不受外部并发操作影响的「独立」环境下运行。 |
持久性(Durable) | 事务完成之后,对于数据的修改是永久生效的。 |
并发事务处理带来的问题
问题 | 含义 |
---|---|
丢失更新(Lost Update) | 当两个或多个事务选择同一行,最初的事务修改的值,会被后面的事务修改的值覆盖。 |
脏读(Dirty Reads) | 事务 T1 将某一值修改但是还未提交,然后事务 T2 读取该值,此后 T1 因为某种原因撤销对该值的修改并提交,这就导致了 T2 所读取到的数据是无效的,值得注意的是,脏读一般是针对于 update 操作的。 |
不可重复读(Non-Repeatable Reads) | 一个事务多次读同一个数据,在这个事务还没有结束时,另一个事务也访问该同一数据并修改数据,那么第一个事务两次读到的数据可能不一样,即一个事务内两次读到的数据是不一样的。 |
幻读(Phantom Reads) | 一个事务按照一定条件进行数据读取,期间其他事务插入了相同搜索条件的新数据,原来的事务再次按照原先条件进行读取时,发现数据变了。 |
脏读、不可重复读侧重于修改,幻读侧重于新增或删除。解决不可重复读的问题只需锁住满足条件的行,解决幻读需要锁表。
不可重复读是在一个时间段多次读取时发现数据改变,幻读是读取后的某个时间(某天),重新读取,发现数据改变。
事务隔离级别
为了解决上述提到的事务并发问题,数据库提供一定的事务隔离机制来解决这个问题。数据库的事务隔离越严格,并发副作用越小,但付出的代价也就越大,因为事务隔离实质上就是使用事务在一定程度上「串行化」进行,这显然与「并发」是矛盾的。
数据库的隔离级别有 4 个,由低到高依次为 Read uncommitted、Read committed、Repeatable read、Serializable,这四个级别可以逐个解决脏写、脏读、不可重复读、幻读这几类问题。
隔离级别 | 丢失更新 | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|---|
Read uncommitted | × | √ | √ | √ |
Read committed | × | × | √ | √ |
Repeatable read(默认) | × | × | × | √ |
Serializable | × | × | × | × |
备注:√ 代表可能出现,× 代表不会出现。
MySQL 的数据库的默认隔离级别为 Repeatable read,查看方式:
show variables like 'tx_isolation';
# InnoDB 的行锁模式
InnoDB 实现了以下两种类型的行锁。
- 共享锁(S):又称为读锁,简称
S
锁,共享锁就是多个事务对于同一数据可以共享一把锁,都能访问到数据,但是只能读不能修改 - 排他锁(X):又称为写锁,简称
X
锁,排他锁就是不能与其他锁并存,如一个事务获取了一个数据行的排他锁,其他事务就不能再获取该行的其他锁,包括共享锁和排他锁,但是获取排他锁的事务是可以对数据就行读取和修改
对于 UPDATE、DELETE、INSERT 语句,InnoDB 会自动给涉及数据集加排他锁(X)
对于普通 SELECT 语句,InnoDB 不会加任何锁;
可以通过以下语句显示给记录集加共享锁或排他锁。
-- 共享锁(S)
SELECT * FROM table_name WHERE ... LOCK IN SHARE MODE
-- 排他锁(X)
SELECT * FROM table_name WHERE ... FOR UPDATE
2
3
4
# 行锁基本演示
准备 SQL
create table test_innodb_lock(
id int(11),
name varchar(16),
sex varchar(1)
)engine = innodb default charset=utf8;
insert into test_innodb_lock values(1,'100','1');
insert into test_innodb_lock values(3,'3','1');
insert into test_innodb_lock values(4,'400','0');
insert into test_innodb_lock values(5,'500','1');
insert into test_innodb_lock values(6,'600','0');
insert into test_innodb_lock values(7,'700','0');
insert into test_innodb_lock values(8,'800','1');
insert into test_innodb_lock values(9,'900','1');
insert into test_innodb_lock values(1,'200','0');
create index idx_test_innodb_lock_id on test_innodb_lock(id);
create index idx_test_innodb_lock_name on test_innodb_lock(name);
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
开启两个会话
Session-1 | Session-2 |
---|---|
关闭自动提交功能 | 关闭自动提交功能 |
可以正常的查询出全部的数据 | 可以正常的查询出全部的数据 |
查询 id 为 3 的数据成功 | 获取 id 为 3 的数据成功; |
更新 id 为 3 的数据,但是不提交 | 更新 id 为 3 的数据,此时处于阻塞状态 |
通过 commit,提交事务 | 解除阻塞,执行更新成功 |
以上,操作的都是同一行的数据,接下来,演示不同行的数据 | 以上,操作的都是同一行的数据,接下来,演示不同行的数据 |
更新 id 为 3 数据,正常的获取到行锁,执行更新 | 由于与 Session-1 操作不是同一行,获取当前行锁,执行更新 |
# 无索引行锁升级为表锁
如果不通过索引条件检索数据,那么 InnoDB 将对表中的所有记录加锁,实际效果跟表锁一样。
-- 查看当前表的索引 :
show index from test_innodb_lock;
2
Session-1 | Session-2 |
---|---|
关闭事务的自动提交 | 关闭事务的自动提交 |
执行更新语句 | 执行更新语句,但处于阻塞状态 |
通过 commit,提交事务 | 解除阻塞,执行更新成功 |
执行提交操作 |
由于执行更新时,name 字段本来为 varchar 类型,我们是作为数字类型使用,存在类型转换,索引失效,最终行锁变为表锁;
# 间隙锁危害
当我们用范围条件,而不是使用相等条件检索数据,并请求共享或排他锁时,InnoDB 会给符合条件的已有数据进行加锁;对于键值在条件范围内但并不存在的记录,叫做 间隙(GAP),InnoDB 也会对这个「间隙」加锁,这种锁机制就是所谓的 间隙锁(Next-Key锁)。
示例 :
Session-1 | Session-2 |
---|---|
关闭事务自动提交 | 关闭事务自动提交 |
根据 id 范围更新数据,小于 4 的所有 id 被加锁 | |
插入 id 为 2 的记录,处于阻塞状态 | |
提交事务 | |
解除阻塞,执行插入操作 | |
提交事务 |
# InnoDB 行锁争用情况
show status like 'innodb_row_lock%';
Innodb_row_lock_current_waits:当前正在等待锁定的数量
Innodb_row_lock_time:从系统启动到现在锁定总时间长度
Innodb_row_lock_time_avg:每次等待所花平均时长
Innodb_row_lock_time_max:从系统启动到现在等待最长的一次所花的时间
Innodb_row_lock_waits:系统启动后到现在总共等待的次数
当等待的次数很高,而且每次等待的时长也不小的时候,我们就需要分析系统中为什么会有如此多的等待,然后根据分析结果着手制定优化计划。
# 总结
InnoDB 存储引擎由于实现了行级锁定,虽然在锁定机制的实现方面带来了性能损耗可能比表锁会更高一些,但是在整体并发处理能力方面要远远由于 MyISAM 的表锁的。当系统并发量较高的时候,InnoDB 的整体性能和 MyISAM 相比就会有比较明显的优势。
但是,InnoDB 的行级锁同样也有其脆弱的一面,当我们使用不当的时候,可能会让 InnoDB 的整体性能表现不仅不能比 MyISAM 高,甚至可能会更差。
优化建议:
- 尽可能让所有数据检索都能通过索引来完成,避免无索引行锁升级为表锁
- 合理设计索引,尽量缩小锁的范围
- 尽可能减少索引条件,及索引范围,避免间隙锁
- 尽量控制事务大小,减少锁定资源量和时间长度
- 尽可使用低级别事务隔离(但是需要业务层面满足需求)