说起redis锁,以下三个是最常用的高频词:
setnxredLockredisson
setnx
其实目前所谓的setnx命令并不仅仅指redis的setnx键值命令。
一般是指在redis中使用set命令加上nx参数。目前,set命令已经支持这么多可选参数:
SETkeyvalue[EXseconds | pxmillisches][NX | XX][KEEPTTL]
当然,我不会在文章里默默写Api。如果基本参数不清楚,可以跳转到官网。
上图是作者绘制的setnx的一般原理,主要依靠其Key不存在的特性来设置成功。进程A获得锁,当锁的密钥没有被删除时,进程B自然无法获得锁。
那为什么要用PX 30000来设置超时呢?
恐怕进程A没有意义,锁也不是等着被释放的。如果崩溃了,我直接把锁拿走,系统里没人能拿到锁。
即便如此,仍然不能保证万无一失。
如果进程A不合理,操作锁中的资源超过了作者设置的超时,会导致其他进程获得锁。当进程A回来,回手就是删除其他进程的锁,如图:
刚才同一张图中,时间T5改为锁定超时,由redis发布。
进程B在不到一会儿的时间里愉快地在T6获得了锁,进程A完成了操作,返回了一个del并释放了锁。
当进程B的操作完成,锁被释放时(图中时间T8):
其实找到锁也不错。如果一个进程C在T7成功锁定,那么进程B将释放进程C的锁,以此类推,进程C可能释放进程D的锁,进程D.(禁止筑巢),具体后果未知。
因此,在使用setnx时,虽然键起着主要作用,但值不能闲置。您可以设置一个唯一的客户端标识或使用一个随机数,如UUID。
解锁时,先获取值确定是否是当前进程添加的锁,然后删除。伪代码:
Stringuuid=xxxx
//伪代码,项目中使用的连接工具的具体实现。
//提供的方法有的被命名为set,有的被命名为setIfAbsent。
setTestuuidNXPX3000
尝试{
//bizhandle.
}最后{
//解锁
if(uuid . equals(redistool . get(' Test ')){)
redistool . del(' Test ');
}
}
这次看起来稳定吗?
相反,这一次,问题更加明显。在finally代码块中,get和del不是原子操作,但仍然存在进程安全问题。
有问题为什么要说些什么?
这么多呢?第一,搞清劣势所在,才能更好的完善。
第二点,其实上文中最后这段代码,还是有很多公司在用的。
大小项目悖论:大公司实现规范,但是小司小项目虽然存在不严谨,可并发倒也不高,出问题的概率和大公司一样低。 -- 正直的心情
那么删除锁的正确姿势之一,就是可以使用lua脚本,通过redis的eval/evalsha命令来运行:
-- lua删除锁: -- KEYS和ARGV分别是以集合方式传入的参数,对应上文的Test和uuid。 -- 如果对应的value等于传入的uuid。 if redis.call('get', KEYS[1]) == ARGV[1] then -- 执行删除操作 return redis.call('del', KEYS[1]) else -- 不成功,返回0 return 0 end通过lua脚本能保证原子性的原因说的通俗一点:
就算你在lua里写出花,执行也是一个命令(eval/evalsha)去执行的,一条命令没执行完,其他客户端是看不到的。
那么既然这么麻烦,有没有比较好的工具呢?就要说到redisson了。
介绍redisson之前,笔者简单解释一下为什么现在的setnx默认是指set命令带上nx参数,而不是直接说是setnx这个命令。
因为redis版本在2.6.12之前,set是不支持nx参数的,如果想要完成一个锁,那么需要两条命令:
1. setnx Test uuid 2. expire Test 30即放入Key和设置有效期,是分开的两步,理论上会出现1刚执行完,程序挂掉,无法保证原子性。
但是早在2013年,也就是7年前,Redis就发布了2.6.12版本,并且官网(set命令页),也早早就说明了“SETNX, SETEX, PSETEX可能在未来的版本中,会弃用并永久删除”。
笔者曾阅读过一位大佬的文章,其中就有一句指导入门者的面试小套路,具体文字忘记了,大概意思如下:
说到redis锁的时候,可以先从setnx讲起,最后慢慢引出set命令的可以加参数,可以体现出自己的知识面。
如果有缘你也阅读过这篇文章,并且学到了这个套路,作为本文的笔者我要加一句提醒:
请注意你的工作年限!首先回答官网表明即将废弃的命令,再引出set命令七年前的“新特性”,如果是刚毕业不久的人这么说,面试官会以为自己穿越了。
你套路面试官,面试官也会套路你。 -- vt・甜蜜的唇膏
Redisson
Redisson是java的redis客户端之一,提供了一些api方便操作redis。
但是redisson这个客户端可有点厉害,笔者在官网截了仅仅是一部分的图:
这个特性列表可以说是太多了,是不是还看到了一些JUC包下面的类名,redisson帮我们搞了分布式的版本,比如AtomicLong,直接用RedissonAtomicLong就行了,连类名都不用去新记,很人性化了。
锁只是它的冰山一角,并且从它的wiki页面看到,对主从,安静的橘子,集群等模式都支持,当然了,单节点模式肯定是支持的。
本文还是以锁为主,其他的不过多介绍。
Redisson普通的锁实现源码主要是RedissonLock这个类,还没有看过它源码的盆友,不妨去瞧一瞧。
源码中加锁/释放锁操作都是用lua脚本完成的,封装的非常完善,开箱即用。
这里有个小细节,加锁使用setnx就能实现,也采用lua脚本是不是多此一举?笔者也非常严谨的思考了一下:这么厉害的东西哪能写废代码?
其实笔者仔细看了一下,加锁解锁的lua脚本考虑的非常全面,其中就包括锁的重入性,这点可以说是考虑非常周全,我也随手写了代码测试一下:
的确用起来像jdk的ReentrantLock一样丝滑,那么redisson实现的已经这么完善,redLock又是什么?
RedLock
redLock的中文是直译过来的,就叫红锁。
红锁并非是一个工具,而是redis官方提出的一种分布式锁的算法。
就在刚刚介绍完的redisson中,就实现了redLock版本的锁。也就是说除了getLock方法,还有getRedLock方法。
笔者大概画了一下对红锁的理解:
如果你不熟悉redis高可用部署,那么没关系。redLock算法虽然是需要多个实例,但是这些实例都是独自部署的,没有主从关系。
RedLock作者指出,之所以要用独立的,是避免了redis异步复制造成的锁丢失,比如:主节点没来的及把刚刚set进来这条数据给从节点,就挂了。
有些人是不是觉得威武的哈密瓜,数据线都是杠精啊,天天就想着极端情况。其实高可用嘛,拼的就是99.999...% 中小数点后面的位数。
回到上面那张简陋的图片,红锁算法认为,只要(N/2) + 1个节点加锁成功,那么就认为获取了锁, 解锁时将所有实例解锁。流程为:
顺序向五个节点请求加锁根据一定的超时时间来推断是不是跳过该节点三个节点加锁成功并且花费时间小于锁的有效期认定加锁成功也就是说,假设锁30秒过期,三个节点加锁花了31秒,自然是加锁失败了。
这只是举个例子,实际上并不应该等每个节点那么长时间,就像官网所说的那样,假设有效期是10秒,那么单个redis实例操作超时时间,应该在5到50毫秒(注意时间单位)
还是假设我们设置有效期是30秒,图中超时了两个redis节点。那么加锁成功的节点总共花费了3秒,所以锁的实际有效期是小于27秒的。
即扣除加锁成功三个实例的3秒,还要扣除等待超时redis实例的总共时间。
看到这,你有可能对这个算法有一些疑问,那么你不是一个人。
回头看看Redis官网关于红锁的描述
就在这篇描述页面的最下面,你能看到著名的关于红锁的zgdyet打架事件。
即Martin Kleppmann和antirez的redLock辩论. 一个是很有资历的分布式架构师,一个是redis之父。
官方挂人,最为致命。
开个玩笑,要是质疑能被官方挂到官网,说明肯定是有价值的。
所以说如果项目里要使用红锁,除了红锁的介绍,不妨要多看两篇文章,即:
Martin Kleppmann的质疑贴antirez的反击贴总结
看了这么多,是不是发现如何实现,都不能保证100%的稳定。
程序就是这样,没有绝对的稳定,所以做好人工补偿环节也是重要的一环,毕竟:技术不够,人工来凑~