redis中的数据类型(Set与ZSet)

发布于:2024-10-09 ⋅ 阅读:(50) ⋅ 点赞:(0)

(一)set

   set在我们目前有两个意思,首先就是这里使用的集合,第二个是我们的set和get方法

  因为set是一个集合,所以他具有集合的一些特点:

1.集合中的元素无序    2.集合中的元素是不可重复的   3.集合间是可以取交集,并集,差集

1.set的一些命令

    1)sadd

   将一个或者多个元素添加到set中,如果元素重复虽然不会报错,但是没有添加到set中(会影响返回值)

时间复杂度O(1),返回值为添加的元素个数

2)smembers

  用来获取一个set中的所有元素,元素的顺序是无序的

时间复杂度为O(N),返回值为所有元素的列表

3)sismember

用来判断一个元素在不在set中

时间复杂度是O(1),返回值如果为1就表示在集合中,如果为0就表示不在集合中或者key不存在

4)scard

 获取一个set中的元素个数

时间复杂度O(1),返回值为set内元素个数

5)spop

 从set中删除并且返回一个或者多个随机元素(是因为set是无序的,所以才是随机元素)

时间复杂度为O(N),n为count,count表示要删除多少个元素

返回值为取出元素

6)smove

将一个元素从一个set移动到另一个set中

时间复杂度为O(1),返回值1表示移动成功,0表示失败

当我们想移动的元素不存在时就会返回0

7)srem

将指定元素从set中删除,可以删除一个也可以删除多个

返回值为删除成功的元素个数

时间复杂度O(N),N为要删除的元素个数

8)sinter&sinterstore

sinter

获取给定的set的交集

时间复杂度为O(N*M),n为最小的集合元素个数,m为最大的集合元素个数

返回值为交集的元素

sinterstore

获取给定set的交集中的元素并保存到目标set中

时间复杂度与sinter一样

返回值为交集的个数

9)sunion&sunionstore

sunion

获取给定set的并集中元素

时间复杂度为O(N),N为给定的所有集合的总的元素个数

返回值为并集的元素

sunionstore

把给定的set的并集放到另一个set中

时间复杂度与sunion一样

返回值为并集的元素个数

10)sdiff&sdiffstore

sdiff

  获取给定set的差集中的元素

时间复杂度O(N),N为给定的所有集合的总元素个数

返回值为差集中的元素

sdiffstore

获取给定set的差集中的元素并保存到⽬标set中

时间复杂度O(N),N给定的所有集合的总的元素个数

返回值为差集的元素个数

2.内部编码

   1)intset(整数集合)

 当集合中的元素都是整数,并且元素的个数不多时。redis会使用intset来作为集合的内部实现,来减少内存的使用。

   2)hashtable(哈希表)

  当集合元素比较多或者不全为整数不满足intset时,redis会使用hashtable来实现内部编码

3.使用场景

   1)作为标签

    我们可以向用户的集合中添加标签,也可以向标签集合中添加用户

我们就可以通过这些来统计一些用户的共同特点,来进行一些推送

  2)使用set计算共同好友

  我们可以通过set的集合特点,通过求交集的方式,来求出共同好友,并且可以通过并集和差集再做一些好友推送的功能

3)使用Set统计UV

 这里用到set的去重的特点

   我们来理解下什么是UV

一个互联网通常使用PV和UV来衡量用户量

   PV:用户每次访问服务器都会产生一个PV

   UV:每个用户,访问服务器都会有一个UV,但是同一个用户多次访问UV不会变化

这就是PV与UV的区别,使用set的去重功能可以很好的实现UV

(二)zset

   zset叫做有序集合,我们说set里的元素是不可以重复的且是无序的,而zset保留了我们元素不可以重复,但是元素间是有序的了,那既然有序就一定会根据一个标准来判断大小,那这个判断的标准就是每个元素带着的唯一的浮点类型的分数(score)

  那这个有序,我们默认是升序

  列表.集合.有序集合三者的异同点

 1.zset的一些命令

   1)zadd

 用来向有序集合中添加或者更新元素的方法,注意我们是有序集合,所以要在后面再填上关联的分数,分数要符合double类型(inf和-inf作为最大值和最小值)

 我们zadd命令有很多参数

xx:我们之前说过,用于更新已经存在的元素,更新后我们仍要保持有序

nx:与xx相对,用于添加元素,不会更新存在的元素

ch:zadd默认的返回值是这次新添加的元素,并不会返回更新的元素,而使用这个参数后,这次的返回值就会包含更新元素的个数

incr:我们说元素会携带一个自己的分数,这个会使我们的分数+1

同时这里我们阅读redis官方文档还会发现有两个参数这里没有写

时间复杂度为O(logN),返回值为本次成功添加的元素个数

2)zcard

 获取一个zset的基数,也就是zset的元素个数

时间复杂度是O(1),返回值为zset的元素个数

3)zcount

 我们说每个元素都携带一个自己的分数,这个命令可以根据分数区间来查询元素个数

 之前在查询给定区间的数目时我们就说,redis默认查询是闭区间,那么我们怎么查询给定区间的开区间呢?这里redis还是比较独特的,我们一般会认为是使用()来括起来,但是实际上,redis只使用(

时间复杂度O(logN),返回值为满足的元素列表个数

4)zrange&zrevrange

    zrange

   返回指定区间里的元素,我们可以通过加上withscores这个参数来把分数也一起返回

 

   我们要注意,这里跟zcount有一个很大的区别,zcount是通过分数来查询,而zrange是根据下标来查询

  时间复杂度为O(log(N)+M),返回值为区间内的元素列表

  zrevrange

  返回指定区间里的元素,分数按找降序来排序其余和zrange是一样的

时间复杂度为O(log(N)+M),返回值为区间内的元素列表

 5)zrangebyscore

  从名字可看出,这个是根据元素携带的分数来进行返回

 这里跟zcount一样,都可以使用( 来使用开区间

时间复杂度为O(log(N)+M),返回值为区间内的元素列表

 6)zpopmax&bzpopmax

用来删除并且返回分数最高的count个元素,如果分数相同就会按照字典序来进行删除

  时间复杂度为O(log(N)*M)而之所以是这个时间复杂度,是因为我们在zset中查找一个元素的时间复杂度是logN,然后我们要删除count个就需要*M

  但是我个人认为,redis源码中记录了zset中的最后一个元素,为什么不直接进行删除?可能是因为redis的设计者图方便直接调用了一个通用的删除函数。给定一个member值,查找到位置后进行删除,所以这里是可以进行优化的。

  返回值为分数和元素列表

  bzpopmax(我们这里有关的阻塞时间单位都是S)

zpopmax的阻塞版本,也是用来删除最大的元素,可以用多个有序集合中删除

  时间复杂度为O(logN),返回值是从那个有序集合删除,和删除的元素及其分数

7)zpopmin&bzpopmin

 zpopmin

  删除并返回分数最低的count个元素

时间复杂度O(log(N)*M),返回值为分数和元素列表

 bzpopmin

时间复杂度为O(logN),返回值为元素列表

8)zrank&zrevrank

 zrank

 返回指定元素的排名(升序返回)

 这里是根据member来返回,返回的排名其实就是他的下标

时间复杂度为O(logN),返回值为排名的下标

zrevrank

返回指定元素的排名(降序返回)

时间复杂度为O(logN),返回值为排名的下标

9)zscore

 返回指定元素的分数,通过member来查询

  时间复杂度为O(1),这里之所以是O(1),是因为redis做了一些特殊优化,通过舍弃一些空间,来把时间复杂度进行优化,返回值就是对应member的score

10)zrem

 删除指定的元素

 时间复杂度为O(log(N)*M),返回值为操作删除的元素个数

 11)zremrangebyrank&zremrangebyscore

   zremrangebyrank

  按照顺序删除一个范围内的所有元素

时间复杂度为O(logN+M),返回值就是删除元素的个数

  zremrangebyscore

时间复杂度为O(logN+M),返回值就是删除元素的个数

12)zincrby

 给指定的member对应的score加上一个值

时间复杂度:O(log(N)) 返回值:增加后元素的分数

  集合间的一些操作

  zinterstore,zunionstore,与set类似,都是求交集或者并集后放到另一个有序集合中

  这里的numkeys是指定后面有多少个key,为了防止类似粘包问题

2.zset的内部编码

 ziplist:这个我们在list和hash中都有这样的内部编码,当有序集合的元素个数少于一定数目,就会使用ziplist来作为有序集合的内部实现,用来减少内存的使用,但是元素过多就会导致元素操作变慢。

 skiplist:当ziplist条件不满足时,就会使用skiplist作为内部实现,skiplist就相当于是一个复杂链表,链表指向的下一个元素是跳跃性的,通过一定计算也可以保证访问元素的时间复杂度为O(logN)

3.使用场景

 有序集合因为内置了score所以最合适的使用场景就是排行榜系统

 因为排行榜用zset来实现是非常简单的,如果我们要统计排名,只需要把他的分数当作score,zset会自动给我们进行排序,然后形成排行榜,然后按照下标来进行范围查询,如果我们分数改变,也可以使用zincrby来修改分数,排行的顺序也可以自动调整

  上述只根据一个score来排序是很容易的,但是我们大多数情况下,单一一个分数是不可以得出排行的,比如微博的热度榜,我们要综合一条微博的浏览量,点赞量,转发量等,根据不同的比例来计算,得到综合得分,通过这个得分来排序得到排行榜

  这时我们可以使用zinterstore和zunionstore的方式处理,把每个值放到对应的有序集合中,然后使用这两条指令,来进行运算并且放到一个新有序集合的,这时得到的新集合就是排行榜