黑马点评面试要点
简历上展示黑马点评
项目描述
黑马点评项目是一个springboot开发的前后端分离项目,使用了redis集群、tomcat集群、MySQL集群提高服务性能。类似于大众点评,实现了短信登录、商户查询缓存、优惠卷秒杀、附近的商户、UV统计、用户签到、好友关注、达人探店 八个部分形成了闭环。其中重点使用了分布式锁实现了一人一单功能、项目中大量使用了Redis 的知识。
所用技术
SpringBoot+nginx+MySql+Lombok+MyBatis-Plus+Hutool+Redis
使用 Redis 解决了在集群模式下的 Session共享问题,使用拦截器实现用户的登录校验和权限刷新
基于Cache Aside模式解决数据库与缓存的一致性问题
使用 Redis 对高频访问的信息进行缓存,降低了数据库查询的压力,解决了缓存穿透、雪崩、击穿问题使用 Redis + Lua脚
本实现对用户秒杀资格的预检,同时用乐观锁解决秒杀产生的超卖问题
使用Redis分布式锁解决了在集群模式下一人一单的线程安全问题
基于stream结构作为消息队列,实现异步秒杀下单
使用Redis的 ZSet 数据结构实现了点赞排行榜功能,使用Set 集合实现关注、共同关注功能
黑马定评项目 亮点难点
使用Redis解决了在集群模式下的Session共享问题,使用拦截器实现了用户的登录校验和权限刷新
为什么用Redis替代Session?
使用Session时,根据客户端发送的session-id获取Session,再从Session获取数据,由于Session共享问题:多台Tomct并不共享session存储空间,当请求切换到不同tomcat服务时导致数据丢失的问题。
解决方法:用Redis代替Session存储User信息,注册用户时,会生成一个随机的Token作为Key值存放用户到Redis中。
还有其他解决方法吗?
基于 Cookie 的 Token 机制,不再使用服务器端保存 Session,而是通过客户端保存 Token(如 JWT)。
Token 包含用户的认证信息(如用户 ID、权限等),并通过签名验证其完整性和真实性。
每次请求,客户端将 Token 放在 Cookie 或 HTTP 头中发送到服务
说说你的登录流程?
使用Redis代替session作为缓存,使用Token作为唯一的key值
怎么使用拦截器实现这些功能?
系统中设置了两层拦截器:
第一层拦截器是做全局处理,例如获取Token,查询Redis中的用户信息,刷新Token有效期等通用操作。
第二层拦截器专注于验证用户登录的逻辑,如果路径需要登录,但用户未登录,则直接拦截请求。
使用两层的原因?
使用拦截器是因为,多个线程都需要获取用户,在想要方法之前统一做些操作,就需要用拦截器,还可以拦截没用登录的用户,但只有一层拦截器不是拦截所有请求,所有有些请求不会刷新Token时间,我们就需要再加一层拦截器,拦截所有请求,做到一直刷新。
好处:
职责分离:这种分层设计让每个拦截器的职责更加单一,代码更加清晰、易于维护
提升性能:如果直接在第一层拦截器处理登录验证,可能会对每个请求都进行不必要的检查。而第二层拦截器仅在“需要登录的路径”中生效,可以避免不必要的性能开销。
灵活性:这种机制方便扩展,不需要修改第一层的全局逻辑。
复用 ThreadLocal 数据:第一层拦截器已经将用户信息保存到 ThreadLocal 中,第二层拦截器可以直接使用这些数据,而不需要重复查询 Redis 或其他数据源。
基于Cache Aside模式解决数据库与缓存的一致性问题
怎么保证缓存更新策略的高一致性需求?
我们使用的时Redisson实现的读写锁,再读的时候添加共享锁,可以保证读读不互斥,读写互斥。我们更新数据的时候,添加排他锁,他是读写,读读都互斥,这样就能保证在写数据的同时,是不会让其他线程读数据的,避免了脏数据。读方法和写方法是同一把锁。
使用 Redis 对高频访问的信息进行缓存,降低了数据库查询的压力,解决了缓存穿透、雪崩、击穿问题
什么是缓存穿透,怎么解决?
定义: 1.用户请求的id在缓存中不存在。
2.恶意用户伪造不存在的id发起请求。
大量并发去访问一个数据库不存在的数据,由于缓存中没有该数据导致大量并发查询数据库,这个现象叫缓存穿透。
缓存穿透可以造成数据库瞬间压力过大,连接数等资源用完,最终数据库拒绝连接不可用。
解决方法:
1.对请求增加校验机制
eg:字段id是长整型,如果发来的不是长整型则直接返回
2.使用布隆过滤器
为了避免缓存穿透我们需要缓存预热将要查询的课程或商品信息的id提前存入布隆过滤器,添加数据时将信息的id也存入过滤器,当去查询一个数据时先在布隆过滤器中找一下如果没有到到就说明不存在,此时直接返回。
3.缓存空值或特殊值(本项目应用)
请求通过了第一步的校验,查询数据库得到的数据不存在,此时我们仍然去缓存数据,缓存一个空值或一个特殊值的数据。
但是要注意:如果缓存了空值或特殊值要设置一个短暂的过期时间。
什么是缓存雪崩,怎么解决?
定义: 缓存雪崩是缓存中大量key失效后当高并发到来时导致大量请求到数据库,瞬间耗尽数据库资源,导致数据库无法使用。
造成缓存雪崩问题的原因是是大量key拥有了相同的过期时间,比如对课程信息设置缓存过期时间为10分钟,在大量请求同时查询大量的课程信息时,此时就会有大量的课程存在相同的过期时间,一旦失效将同时失效,造成雪崩问题。
解决方法:
1、使用同步锁控制查询数据库的线程
使用同步锁控制查询数据库的线程,只允许有一个线程去查询数据库,查询得到数据后存入缓存。
1 | synchronized(obj){ |
2、对同一类型信息的key设置不同的过期时间
通常对一类信息的key设置的过期时间是相同的,这里可以在原有固定时间的基础上加上一个随机时间使它们的过期时间都不相同。
1 | //设置过期时间300秒 |
3、缓存预热
不用等到请求到来再去查询数据库存入缓存,可以提前将数据存入缓存。使用缓存预热机制通常有专门的后台程序去将数据库的数据同步到缓存。
什么是缓存击穿,怎么解决?
定义: 缓存击穿是指大量并发访问同一个热点数据,当热点数据失效后同时去请求数据库,瞬间耗尽数据库资源,导致数据库无法使用。
比如某手机新品发布,当缓存失效时有大量并发到来导致同时去访问数据库。
解决方法:
1.基于互斥锁解决
互斥锁(时间换空间)
优点:内存占用小,一致性高,实现简单
缺点:性能较低,容易出现死锁
这里使用Redis中的setnx指令实现互斥锁,只有当值不存在时才能进行set操作
锁的有效期更具体业务有关,需要灵活变动,一般锁的有效期是业务处理时长10~20倍
线程获取锁后,还需要查询缓存(也就是所谓的双检),这样才能够真正有效保障缓存不被击穿
2.基于逻辑过期方式
逻辑过期(空间换时间)
优点:性能高
缺点:内存占用较大,容易出现脏读
·注意:逻辑过期一定要先进行数据预热,将我们热点数据加载到缓存中
适用场景
商品详情页、排行榜等热点数据场景。
数据更新频率低,但访问量大的场景。
总结:两者相比较,互斥锁更加易于实现,但是容易发生死锁,且锁导致并行变成串行,导致系统性能下降,逻辑过期实现起来相较复杂,且需要耗费额外的内存,但是通过开启子线程重建缓存,使原来的同步阻塞变成异步,提高系统的响应速度,但是容易出现脏读
为什么重建子线程,作用是什么?
开启子线程重建缓存的作用在于提高系统的响应速度,避免因缓存击穿导致的数据库压力过大,同时保障系统在高并发场景下的稳定性,但开启子线程重建缓存可能引入数据不一致(脏读)问题
具体原因:
- 提高系统响应速度
同步阻塞的缺点: 在缓存失效时,传统方案通常会同步查询数据库更新缓存,这会导致用户请求被阻塞,特别是在高并发环境下可能出现大量线程等待,影响系统响应性能。
子线程重建缓存的优势:
主线程只需返回缓存中的旧数据,避免阻塞用户请求。
重建缓存的任务交由后台线程执行,提高用户体验。
- 减少数据库压力
缓存击穿问题: 当热点数据过期时,多个线程同时访问数据库,可能导致数据库压力骤增,甚至崩溃。
子线程异步重建缓存:
将数据库查询集中到一个后台线程中执行,避免多个线程同时查询数据库。
即便在缓存击穿的情况下,也不会对数据库造成过大的负载。
- 提高系统吞吐量
同步更新的瓶颈: 如果所有线程都等待缓存更新完成,系统吞吐量会因阻塞而降低。
异步重建的优化:
主线程可以快速返回旧数据,提升并发处理能力。
数据更新操作与用户请求分离,减少了阻塞等待。
- 减少热点数据竞争
高并发场景下的竞争: 热点数据被大量请求时,多个线程可能同时触发缓存更新逻辑,产生资源竞争。
单子线程更新的效果:
后台线程独占更新任务,避免多线程竞争更新缓存。
配合分布式锁机制,可以有效减少竞争开销。
- 提升系统的稳定性
数据库保护:
异步更新缓存,减缓数据库的瞬时高并发压力。
在极端情况下,即使缓存更新失败,系统仍能通过返回旧数据保持基本的服务能力。
熔断机制结合:
子线程的异步更新可以结合熔断、降级等机制,当更新任务失败时,系统可快速响应并记录失败日志以便后续处理。
·适用场景
热点数据: 商品详情页、排行榜等访问量极高的场景。
高并发场景: 秒杀、抢购活动中,需要频繁访问热点数据。
容忍短暂数据不一致的场景: 如排行榜数据的延迟更新对用户体验影响较小。
使用 Redis + Lua脚本实现对用户秒杀资格的预检,同时用乐观锁解决秒杀产生的超卖问题
什么是超卖问题,怎么解决?
超卖问题:并发多线程问题,当线程1查询库存后,判断前,又有别的线程来查询,从而造成判断错误,超卖。
解决方式:
1 | 悲观锁: 添加同步锁,让线程串行执行 |
1 | 乐观锁:不加锁,再更新时判断是否有其他线程在修改 |
说一下乐观锁和悲观锁?
悲观锁:悲观锁总是假设最坏的情况,认为共享资源每次被访问的时候就会出现问题(比如共享数据被修改),所以每次在获取资源操作的时候都会上锁,这样其他线程想拿到这个资源就会阻塞直到锁被上一个持有者释放。也就是说,共享资源每次只给一个线程使用,其它线程阻塞,用完后再把资源转让给其它线程。
乐观锁:乐观锁总是假设最好的情况,认为共享资源每次被访问的时候不会出现问题,线程可以不停地执行,无需加锁也无需等待,只是在提交修改的时候去验证对应的资源(也就是数据)是否被其它线程修改了(具体方法可以使用版本号机制或 CAS 算法)。
悲观锁通常多用于写比较多的情况(多写场景,竞争激烈),这样可以避免频繁失败和重试影响性能,悲观锁的开销是固定的。不过,如果乐观锁解决了频繁失败和重试这个问题的话(比如LongAdder),也是可以考虑使用乐观锁的,要视实际情况而定。
乐观锁通常多用于写比较少的情况(多读场景,竞争较少),这样可以避免频繁加锁影响性能。不过,乐观锁主要针对的对象是单个共享变量(参考java.util.concurrent.atomic包下面的原子变量类)。
你使用的什么?
使用的是乐观锁CAS算法。CAS是一个原子操作,底层依赖于一条CPU的原子指令。
设计三个参数:
- V:要更新的变量值
- E:预期值
- N:拟入的新值
当且仅当V的值等于E时,CAS通过原子方式用新值N来更新V的值。如果不等,说明已经有其他线程更新了V,则当前线程放弃更新。

从业务的角度看,只要库存数还有,就能执行这个操作,所以where条件设置为stock>0
使用Redis分布式锁解决了在集群模式下一人一单的线程安全问题
为了防止批量刷券,添加逻辑:根据优惠券id和用户id查询订单,如果不存在,则创建。
在集群模式下,加锁只是对该JVM给当前这台服务器的请求的加锁,而集群是多台服务器,所以要使用分布式锁,满足集群模式下多进程可见并且互斥的锁。
Redis分布式锁实现思路?
我使用的Redisson分布式锁,他能做到可重入,可重试
可重入:同一线程可以多次获取同一把锁,可以避免死锁,用hash结构存储。
大key是根据业务设置的,小key是线程唯一标识,value值是当前重入次数。

可重试:Redisson手动加锁,可以控制锁的失效时间和等待时间,当锁住的一个业务并没有执行完成的时候,Redisson会引入一个Watch Dog看门狗机制。就是说,每隔一段时间就检查当前事务是否还持有锁。如果持有,就增加锁的持有时间。当业务执行完成之后,需要使用释放锁就可以了。还有个好处就是,在高并发
下,一个业务有可能会执行很快。客户1持有锁的时候,客户2来了以后并不会马上拒绝,他会自旋不断尝试获取锁。如果客户1释放之后,客户2可以立马持有锁,性能也能得到提升。
主从一致性:连锁(multiLock)-不再有主从节点,都获取成功才能获取锁成功,有一个节点获取锁不成功就获取锁失败
一个宕机了,还有两个节点存活,锁依旧有效,可用性随节点增多而增强。如果想让可用性更强,也可以给多个节点建立主从关系,做主从同步,但不会有主从一致问题,当新线程来新的主节点获取锁,由于另外两个主节点依然有锁,不会出现锁失效问题吗,所以不会获取成功。
基于stream结构作为消息队列,实现异步秒杀下单
为什么用异步秒杀?
我们用jmeter测试,发现高并发下异常率高,吞吐量低,平均耗时高
整个业务流程是串行执行的,查询优惠券,查询订单,减库存,创建订单这四步都是走的数据库,mysql本身并发能力就较少,还有读写操作,还加了分布式锁,整个业务耗时长,并发能力弱。
怎么进行优化?
我们分成两个线程,我们将耗时较短的逻辑判断放到Redis中,例如:库存是否充足,是否一人一单这样的操作,只要满足这两条操作,那我们是一定可以下单成功的,不用等数据真的写进数据库,我们直接告诉用户下单成功就好了,将信息引入异步队列记录相关信息,然后后台再开一个线程,后台线程再去慢慢执行队列里的消息,这样我们就能很快的完成下单业务。
- 当用户下单之后,判断库存是否充足,只需要取Redis中根据key找对应的value是否大于0即可,如果不充足,则直接结束。如果充足,则在Redis中判断用户是否可以下单,如果set集合中没有该用户的下单数据,则可以下单,并将userId和优惠券存入到Redis中,并且返回0,整个过程需要保证是原子性的,所以我们要用Lua来操作,同时由于我们需要在Redis中查询优惠券信息,所以在我们新增秒杀优惠券的同时,需要将优惠券信息保存到Redis中
- 完成以上逻辑判断时,我们只需要判断当前Redis中的返回值是否为0,如果是0,则表示可以下单,将信息保存到queue中去,然后返回,开一个线程来异步下单,其阿奴单可以通过返回订单的id来判断是否下单成功
说说stream类型消息队列?
使用的是消费者组模式(Consumer Group
)
- 消费者组(Consumer Group):将多个消费者划分到一个组中,监听同一个队列,具备以下特点
- 消息分流
- 队列中的消息会分留给组内的不同消费者,而不是重复消费者,从而加快消息处理的速度
- 消息标识
- 消费者会维护一个标识,记录最后一个被处理的消息,哪怕消费者宕机重启,还会从标识之后读取消息,确保每一个消息都会被消费
- 消息确认
- 消费者获取消息后,消息处于pending状态,并存入一个pending-list,当处理完成后,需要通过XACK来确认消息,标记消息为已处理,才会从pending-list中移除
- 消息分流
基本语法:
创建消费者组
1
XGROUP CREATE key groupName ID [MKSTREAM]
- key: 队列名称
- groupName: 消费者组名称
- ID: 起始ID标识,$代表队列中的最后一个消息,0代表队列中的第一个消息
- MKSTREAM: 队列不存在时自动创建队列
删除指定的消费者组
1
XGROUP DESTORY key groupName
给指定的消费者组添加消费者
1
XGROUP CREATECONSUMER key groupName consumerName
删除消费者组中指定的消费者
1
XGROUP DELCONSUMER key groupName consumerName
从消费者组中读取消息
1
XREADGROUP GROUP group consumer [COUNT count] [BLOCK milliseconds] [NOACK] STREAMS key [keys ...] ID [ID ...]
- group: 消费者组名称
- consumer: 消费者名,如果消费者不存在,会自动创建一个消费者
- count: 本次查询的最大数量
- BLOCK milliseconds: 当前没有消息时的最大等待时间
- NOACK: 无需手动ACK,获取到消息后自动确认(一般不用,我们都是手动确认)
- STREAMS key: 指定队列名称
- ID: 获取消息的起始ID
>
:从下一个未消费的消息开始(pending-list中)- 其他:根据指定id从pending-list中获取已消费但未确认的消息,例如0,是从pending-list中的第一个消息开始
基本思路:
1 | while(true){ |
XREADGROUP命令的特点?
- 消息可回溯
- 可以多消费者争抢消息,加快消费速度
- 可以阻塞读取
- 没有消息漏读风险
- 有消息确认机制,保证消息至少被消费一次
✅改进: 使用RabbitMQ更适合。相关文章;
1.在application.yml
中配置RabbitMQ
1 | spring: |
- 2. 声明队列和交换机
- 正常队列和交换机的绑定:
commonExchange (“Common”) → 使用路由键 “CQ” 绑定到 queueC (“CQ”)。 - 死信队列和交换机的绑定:
deadLetterExchange (“Dead-letter”) → 使用路由键 “DLQ” 绑定到 deadLetterQueueD (“DLQ”)。 - 普通队列到死信交换机的关系(死信机制):
queueC (“CQ”) 配置了:- 死信交换机为 Dead-letter;
- 死信路由键为 **”DLQ”**;
- TTL 为 10 秒。
- 当 queueC 中的消息超过 TTL 或触发其它死信条件后,这些消息将被自动发送到 deadLetterExchange,再由 deadLetterExchange 根据 “DLQ” 路由键路由到 deadLetterQueueD。
- 正常队列和交换机的绑定:
1 |
|
3.发送者
1 | VoucherOrder order = new VoucherOrder(); |
4.接受者
1 |
|
使用Redis的 ZSet 数据结构实现了点赞排行榜功能,使用Set 集合实现关注、共同关注功能
什么是ZSet?
Zset,即有序集合(Sorted Set),是 Redis 提供的一种复杂数据类型。Zset 是 set 的升级版,它在 set 的基础上增加了一个权重参数 score,使得集合中的元素能够按 score 进行有序排列。
在 Zset 中,集合元素的添加、删除和查找的时间复杂度都是 O(1)。这得益于 Redis 使用的是一种叫做跳跃列表(skiplist)的数据结构来实现 Zset。
为什么使用ZSet数据结构?
一人只能点一次赞,对于点赞这种高频变化的数据,如果我们使用MySQL是十分不理智的,因为MySQL慢、并且并发请求MySQL会影响其它重要业务,容易影响整个系统的性能,继而降低了用户体验。
Zset 的主要特性包括:
- 唯一性:和 set 类型一样,Zset 中的元素也是唯一的,也就是说,同一个元素在同一个 Zset 中只能出现一次。
- 排序:Zset 中的元素是有序的,它们按照 score 的值从小到大排列。如果多个元素有相同的 score,那么它们会按照字典序进行排序。
- 自动更新排序:当你修改 Zset 中的元素的 score 值时,元素的位置会自动按新的 score 值进行调整。
点赞
用ZSet中的add方法增添,时间戳作为score(zadd key value score)
用ZSet中的score方法,来判断是否存在
1 |
|
共同关注
通过Set中的intersect方法求两个key的交集
1 |
|
1 |
|
附近商铺搜索
我使用的是Redis的GEO数据结构,来存储商户地理座标
GEO数据结构简介
- Redis GEO本质:底层基于Sorted Set(有序集合)实现,存储每个位置的经纬度信息,并支持快速范围查询。
- 核心能力:
- 添加位置:存储商户ID及其经纬度。
- 计算距离:获取两个位置间的距离。
- 范围搜索:查找某中心点半径范围内的所有商户。
- 排序:按距离升序或降序返回结果。
基本操作
1. GEOADD:添加地理位置
作用:将经纬度与成员(如商户ID)关联,存储到GEO集合中。
语法:
1 | GEOADD key 经度1 纬度1 成员1 [经度2 纬度2 成员2 ...] |
1 | GEOADD shops:geo 116.397128 39.916527 "shop:1001" 116.405285 39.904987 "shop:1002" |
说明:
- 经纬度范围为:经度(-180 到 180),纬度(-85.05112878 到 85.05112878)。
- 若成员已存在,会更新其经纬度。
- 返回值为成功添加的成员数量(忽略重复成员的更新)。
2. GEOPOS:获取成员坐标
作用:查询指定成员的经纬度。
语法:
1 | GEOPOS key 成员1 [成员2 ...] |
示例:
1 | GEOPOS shops:geo "shop:1001" |
输出:
1 | 1) 1) "116.39712721109390259" # 经度 |
说明:
- 若成员不存在,返回
nil
。 - 返回值为数组格式,顺序与查询成员一致。
3. GEODIST:计算两个成员间的距离
作用:返回两个地理位置之间的距离。
语法:
1 | GEODIST key 成员1 成员2 [单位] |
单位参数:
m
(米,默认)、km
(千米)、mi
(英里)、ft
(英尺)。示例:
1 | GEODIST shops:geo "shop:1001" "shop:1002" km |
输出:
1 | "1.6423" # 单位:千米 |
说明:
- 若任一成员不存在,返回
nil
。 - 使用Haversine公式计算球面距离,误差<0.5%。
4. GEORADIUS:根据中心点搜索半径内的成员
作用:以指定经纬度为中心,搜索半径范围内的成员。
语法:
1 | GEORADIUS key 经度 纬度 半径 单位 [WITHDIST] [WITHCOORD] [ASC|DESC] [COUNT 数量] |
参数说明:
WITHDIST
:返回成员与中心点的距离。WITHCOORD
:返回成员的经纬度。ASC/DESC
:按距离升序/降序排序(默认升序)。COUNT
:限制返回结果数量。
示例:
1 | GEORADIUS shops:geo 116.403847 39.915526 5 km WITHDIST ASC COUNT 10 |
输出:
1 | 1) 1) "shop:1001" # 成员 |
5. GEORADIUSBYMEMBER:根据成员位置搜索
作用:以某个成员的位置为中心,搜索半径范围内的其他成员。
语法:
1 | GEORADIUSBYMEMBER key 成员 半径 单位 [WITHDIST] [WITHCOORD] [ASC|DESC] [COUNT 数量] |
示例:
1 | GEORADIUSBYMEMBER shops:geo "shop:1001" 2 km WITHCOORD |
输出:
1 | 1) 1) "shop:1001" |
用户签到
基于Redis中的BitMap数据结构实现。
- BitMap概念
Bitmap
,即位图,是一串连续的二进制数组(0和1),可以通过偏移量(offset)定位元素。BitMap通过最小的单位bit来进行0|1
的设置,表示某个元素的值或者状态,时间复杂度为O(1)。我们将签到记录为1,为签到记录为0。
由于 bit 是计算机中最小的单位,使用它进行储存将非常节省空间,特别适合一些数据量大且使用二值统计的场景。
Bitmap
本身是用 String
类型作为底层数据结构实现的一种统计二值状态的数据类型。
String
类型是会保存为二进制的字节数组,所以,Redis 就把字节数组的每个 bit 位利用起来,用来表示一个元素的二值状态,你可以把 Bitmap
看作是一个 bit 数组。

- 基本命令
设置标记
即 setbit ,主要是指将某个索引,设置为1(设置0表示抹去标记)
1 |
|
判断存在与否
即 getbit key index ,如果返回1,表示存在否则不存在
1 | /** |
计数
即 bitcount key ,统计和
1 | /** |
项目中我创建了一个记录签到的表,实现签到接口,将当前用户当天签到信息保存到Redis中
1 | /** |
1 | /** |
UV统计
UV统计(Unique Visitor Statistics)是用于衡量网站、应用程序或其他在线服务中独立访客数量的关键指标。以下是关于UV统计的详细解析:
1. UV的定义
- 核心概念:UV(Unique Visitor,独立访客)指在一定时间范围内(通常为一天),访问某网站或页面的不同用户数量。同一用户多次访问仅计为1次124。
- 与PV的区别:
- PV(Page View,页面浏览量):统计用户每次访问页面的次数,多次刷新页面会累加14。
- UV更关注用户身份的唯一性,而PV反映页面热度
2.实现方法
使用HyperLogLog(HLL)数据结构
- 原理:基于概率算法,通过哈希函数估算集合基数(即唯一元素数量),无需存储完整用户数据,极大节省内存。
- Redis实现:
- 内存占用:单个HLL结构仅需≤16KB,误差率<0.81%,适合高并发场景。
- 命令示例:
PFADD key user_id
:添加用户到HLL。PFCOUNT key
:获取UV估算值
模拟用户数据
1 | /** |