实时数据并发写入 Redis 优化

  1. <strong>
  2. <strong>
  3. <strong>

01 背景

当前架构的逻辑是将并发请求数据写入队列中,然后起一个单独的异步线程对数据进行串行处理。这种方式的好处就是不用考虑并发的问题,当然其弊端也是显而易见的~

实时数据并发写入 Redis 优化

02 乐观锁实现数据的并发更新

根据当前业务的数据更新在秒级,key 的碰撞率较低的情况。笔者打算采用使用 CAS 乐观锁方案:使用 Lua 脚本实现 Redis 对数据的原子更新,即便是在并发的情况下其性能也会上一个级别。下面是 CAS 乐观锁实现数据并发更新的流程图:

实时数据并发写入 Redis 优化

根据上面的流程图设计出了 Lua 脚本:

local keys,values=KEYS,ARGV
local version = redis.call('get',keys[1])
if values[1] == '' and version == false
then
\tredis.call('SET',keys[1],'1')
\tredis.call('SET',keys[2],values[2])
\treturn 1
end

if version == values[1]
then
\tredis.call('SET',keys[2],values[2])
\tredis.call('INCR',keys[1])
\treturn 1
else
\treturn 0
end

03 可能存在问题及其解决方案

1,在并发冲突概率大的高竞争环境下,如果CAS一直失败,会一直重试,CPU开销较大。针对这个问题的一个思路是引入退出机制,如重试次数超过一定阈值后失败退出。如:

func main() { for i := 0; i < 10; i++ {
isRetry := execLuaScript()
if !isRetry {
break
}
}
}

func execLuaScript() bool {
ctx := context.Background()
\tr := client.GetRedisKVClient(ctx)
\tdefer r.Close()


\tluaScript := `
local keys,values=KEYS,ARGV
local version = redis.call('get',keys[1])
if values[1] == '' and version == false
then
\tredis.call('SET',keys[1],'1')
\tredis.call('SET',keys[2],values[2])
\treturn 1
end

if version == values[1]
then
\tredis.call('SET',keys[2],values[2])
\tredis.call('INCR',keys[1])
\treturn 1
else
\treturn 0
end`

\tcasVersion, err := r.Get("test_version")

\tkvs := make([]redis.KeyAndValue, 0)
\tkvs = append(kvs, redis.KeyAndValue{"test_version", casVersion.String()})
\tkvs = append(kvs, redis.KeyAndValue{"test", "123123123"})
\tmv, err := r.Eval(luaScript, kvs...)

\tif err != nil {
\t\tlog.Errorf("%v", err)
\t}

\tval, _ := mv.Int64()
\tlog.Debugf(">>>>>> lua 脚本运行结果 :%d", val)
if val == 1 {
// lua 脚本执行成功,无需重试
return false
} else if val == 0 {
return true
}
}

2,Lua 脚本执行时只能在同一台机器上生效,因此在 Redis 集群在就要求相关联的 key 分配到相同机器。这里很多同学可能会问为什么,其实很简单,Redis 是单线程的,倘若 Lua 脚本操作的 key 在不同机器上执行,也就无法保证其执行的原子性了。

解决方法还是从分片技术的原理上找: 数据分片,就是一个 hash 的过程:对 key 做 md5,sha1 等 hash 算法,根据 hash 值分配到不同的机器上。

为了实现将key分到相同机器,就需要相同的 hash 值,即相同的 key(改变 hash 算法也行,但比较复杂)。但 key 相同是不现实的,因为 key 都有不同的用途。但是我们让 key 的一部分相同对我们业务实现来说是可以实现的。那么能不能拿 key 一部分来计算 hash 呢?答案是肯定的,

这就是 Hash Tag 。允许用key的部分字符串来计算hash。当一个key包含 {} 的时候,就不对整个key做hash,而仅对 {} 包括的字符串做 hash。假设 hash 算法为sha1。对 user:{user1}:ids和user:{user1}:tweets ,其 hash 值都等同于 sha1(user1)。

04 小结

对于上面的优化过程,目前代码重构开发工作已经完成,但是还未正式上线,等上线之后再来补一下优化之后性能的提升情况~


作者:haifeiWu
链接:https://juejin.im/post/5dca1ec46fb9a04ab25be4ad


分享到:


相關文章: