redis数据结构:
string,hash,list,set,zset,
bitmap(布隆过滤器), Geohash, hyperLogLog,
tream(redis5.0才有的)
底层数据结构:
Set 跟hash区别是:set就是一个特殊的value为空的hash
Zset(sorted set)底层数据结构是一种跳表:skipList
String数据结构包含了raw,embstr,int三种内部编码
ZipList内部编码有hash,list,zset
set内部编码是hashtable,intset
Redis缓存穿透
缓存穿透是数据为空,导致每次都查不到。可以设置空缓存key-null,但是会导致数据量很大,这时候可以用布隆过滤器;数据校验等辅助手段也可以缓解
布隆过滤器是一种数据结构,比较巧妙的概率型数据结构(probabilistic data structure),特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”。相比于传统的 List、Set、Map 等数据结构,它更高效、占用空间更少,但是缺点是其返回的结果是概率性的,而不是确切的。
HashMap是快,但是占用空间大
布隆过滤器是一个 bit 向量或者说 bit 数组
Redis缓存击穿,单点突破
缓存击穿是高并发下请求同一个数据,改数据缓存过期失效导致查库。
解决方案:
在查库追加分布式锁;
热点数据永不失效;
数据可实时追加时间长度;
Redis缓存雪崩
大量缓存同时失效,导致查库。
解决方案:
设置缓存过期时间均匀化;
热点数据直接永久性
Redis高可用
① 主从复制+哨兵集群;主从复制读写分离提高redis性能,3主3从。哨兵能监控主节点状态,随时切换做到高可用
② RDB+AOF数据持久化
redis缓存淘汰策略
① 定期删除+惰性删除:
定期删除:100ms一次扫描dict中的20个key,进行过期时间检查,过期则删除;
惰性删除:当再次使用到该key时候再检查是否过期,过期则删除;
② 内存空间不足淘汰策略:
默认不删除,一般需要配置为最近最少使用删除原则
Redis提高命中率
① 缓存预热;
② 细粒度缓存;
③ 缓存时间设置永久有效;
④ 一致性哈希算法,一致性哈希是对2^32次方取模,将整个哈希值空间组成一个虚拟的圆环。Dubbo负载均衡也是一致性哈希策略。其实redis不是直接用一致性哈希,而是用的哈希槽slot,里面是crc16算法。Redis集群包含16384个槽位,手动指定槽位具体在哪个机器节点,避免一致性哈希的倾斜问题,另外在容错性与扩展性上与一致性哈希一样。当需要追加机器或者机器挂掉,影响都很小。
Redis使用场景:
a. KV缓存:配置数据、热点数据缓存;
b. 分布式锁:但是其实不适合作为分布式锁,分布式锁建议zk锁。
c. Set key val nx ex 1000 一定要设置时间 注意setnx expire可能会出现问题,不是原子操作,可能导致死锁。
d. 队列,限流
e. 定时任务
f. 频率控制
g. RoaringBitmap
h. 模糊计数
i. 布隆过滤器防止缓存穿透 key-null场景
如果要统计一篇文章的阅读量,可以直接使用 Redis 的 incr 指令来完成。如果要求阅读量必须按用户去重,那就可以使用 set 来记录阅读了这篇文章的所有用户 id,获取 set 集合的长度就是去重阅读量。但是如果爆款文章阅读量太大,set 会浪费太多存储空间。这时候我们就要使用 Redis 提供的 HyperLogLog 数据结构来代替 set,它只会占用最多 12k 的存储空间就可以完成海量的去重统计。但是它牺牲了准确度,它是模糊计数,误差率约为 0.81%
如何正确访问redis中的海量数据?
答:keys算法是遍历算法,时间复杂度O(n),当数据量达到几百万,keys命令会导致redis卡顿,因为redis是单线程程序,顺序执行所有命令,其他指令必须等待keys执行完毕才能继续。解决方案:采用scan命令,通过游标分步进行,不会阻塞线程。返回的结果可能重复,客户端需要去重,另外返回空不一定就没数据,而是要看游标返回零,才表示遍历结束。
scan cursor [MATCH pattern] [COUNT count]
比如:scan 0 match user_token* count 5
输出
1)“6”--游标index
2)1)“user_token:10”
2)“user_token:105”
3)“user_token:101”
4)“user_token:15”
5)“user_token:13”
閱讀更多 wendellFang 的文章