特性
Set是无序且不可重复
一个集合最多可以存储 2 ^ 32 - 1 个元素
使用场景:
标签
共同好友
兴趣&爱好
网页uv(独立访客数)统计
统计每天的新增用户数
key以user:id 以及当天日期,例如 user:uid:20220905; value为Set集合,记录当天登录的用户ID
排行
热点话题
点赞排行
...
黑白名单
存储结构
inset
使用场景
当集合对象同时满足以下两个条件时,对象使用inset编码:
集合对象保存的所有元素都是整数值
集合对象保存的元素数量不超过512个(默认值,配置参数set-max-intset-entries可以修改)
原理分析1
intset的核心是一个字节数组,按照从小到大存放着set元素
encoding:每个元素的编码方式,编码方式指定了一个整数元素占用多少个contents数组位
int16_t 2个字节,16位的整数,范围相当于java 的 short 类型
int32_t 4个字节,32位的整数,范围相当于java 的 int 类型
int64_t 8个字节,64位的整数,范围相当于java 的 Long 类型
length:元素数量
contents:存储具体的元素,元素按照从小到大排序
原理分析2
intset 升级(不支持降级)
第一次插入的是 1 2 3,此时 encoding是int16_t
第二次插入的是 99999,此时计算后得到新元素为 int32_t;
将现有的元素全部转为新的元素类型,并存储在正确的空间上面;
最后将新元素添加进数组内;
由于元素有序排列,所以set的获取操作采用二分查找方式实现,复杂度O(log(N))。
hashtable
使用场景
集合对象保存的所有元素不全是整数值,或者集合对象保存的元素数量超过512个(设定值)
原理分析
hashtable编码的的对象使用字典的方式作为底层实现,其中值就是key,value为null
dictht(散列表)
table:哈希表数组
size:哈希表大小
sizemask:哈希表大小掩码,用于计算索引值
used:该哈希已有节点的数量
dictEntity(散列表节点)
key:实际存储键的地方
union:联合体中就是实际存储值的地方
next:next域指向下一个节点, 可以用来解决哈希冲突问题