当前位置: 首页 > news >正文

Redis 布隆过滤器性能对比分析

redis 实现布隆过滤器实现方法:

1、redis 的 setbit 和 getbit

特点:对于某个bit 设置0或1,对于大量的值需要存储,非常节省空间,查询速度极快,但是不能查询整个key所有的bit,在一次请求有大量的值需要过滤的场景会出现多次请求getbit,性能会急剧下降,需要把多个gitbit合并成批次,使用lua脚本或者pipeline执行提高效率。

2、redis 的 BF.RESERVE,BF.MADD和 BF.MEXISTS

特点:redis 4.0 以上官方提供的一个插件,原生Bloom过滤器,参数包括 布隆过滤器的大小,误差率等,支持批量写入和批量查询,性能更优,针对一次大量请求,批量查询接口性能更快。

以上两种布隆过滤器性能测试结果对比:

硬件:单节点 redis,2G内存,2核cpu

测试条件:布隆过滤器容量都是 10000,容错率都是:0.001, 场景:一次请求需要过滤10000个id,每100个批量查询一次redis, 如此循环 10次。

序号redis setbit getbit(时延单位:毫秒)redis BF.RESERVE,BF.MADD和 BF.MEXISTS (时延单位:毫秒)
115561238
214751164
31734989
430341701
515321254
615791179
715411177
815671045
916981216
1016891275
平均1740.51223.8

3、基于以上的测试结果,如果一次推荐请求用户已经看过10000个视频,需要过滤10000个视频,时延会上涨到秒级以上,这样对于高并发情况性能是不行的,还有其他的办法嘛? 能不能一次性把整个布隆过滤器读到本地再进行过滤?

在推荐场景,布隆过滤器设置了容量5000个,容错率是0.001,布隆过滤器的最大值为:17972 byte,约 17K,如果每次写入和查询都查询整个布隆过滤器,1000qps 占用的网络带宽为: 13.92 Mbps。

测试可行性:本地构造一个布隆过滤器对象 BitSet,BitSet的最大值是int的最大,从redis查询出来序列化成BitSet对象,再进行读写操作,如果是写操作,再序列化写入redis。

private BitSet get(long userId) {String key = TestBloomP.getBitMapKey(userId, "111");log.info("get bitset key:{}", key);return (BitSet) redisTemplate.opsForValue().get(key);
}private void add(long userId, List<Long> filterItems) {BitSet bitSet = new BitSet();for (Long item : filterItems) {String uniqueKey = userId + ":" + item;List<Integer> offsets = TestBloomP.getOffsets(uniqueKey);for (Integer offset : offsets) {bitSet.set(offset);}}String key = TestBloomP.getBitMapKey(userId, "111");log.info("add bitset key:{}, size:{}", key, bitSet.size());redisTemplate.opsForValue().set(key, bitSet);
}

redis 使用java默认的序列化工具JdkSerializationRedisSerializer,测试结果 如下:写操作会先读再写 时延都是很低:

add bitset key:shop_video:filter_exposed:1607433260630157, size:143808, add count:1, time:36
get bitset time:9, bitset :143808

http://www.lryc.cn/news/397960.html

相关文章:

  • Java List不同实现类的对比
  • 【C语言】 —— 预处理详解(下)
  • Jupyter Notebook简介
  • ChatGPT 5.0:一年后的猜想
  • Java套红:指定位置合并文档-NiceXWPFDocument
  • 【操作系统】进程管理——进程的同步与互斥(个人笔记)
  • Qt:13.多元素控件(QLinstWidget-用于显示项目列表的窗口部件、QTableWidget- 用于显示二维数据表)
  • 恢复出厂设置手机变成砖
  • 解决IntelliJ IDEA中克隆GitHub项目不显示目录结构的问题
  • Git错误分析
  • pom.xml中重要标签介绍
  • 大模型日报 2024-07-11
  • Redis基础教程(十六):Redis Stream
  • 机器学习筑基篇,容器调用显卡计算资源,Ubuntu 24.04 快速安装 NVIDIA Container Toolkit!...
  • 全网第一个java链接阿里云redis并可操作
  • Mysql ORDER BY是否走索引?
  • 图纸文档管理新篇章:陕西航沣与三品软件合作 优化研发流程
  • 链式队列的实现
  • 深入剖析3D企业云展厅的价值,多维展示和精准营销的创新结合
  • 前台线程和后台线程(了解篇)
  • 最强文本编辑器 VIM 指令大全
  • 卤味江湖中,周黑鸭究竟该抓住什么赛点?
  • 2024年西安铁一中集训DAY1---- 杂题选讲
  • Python爬虫:BeautifulSoup的基本使用方法!
  • 【自监督学习】DINO in ICCV 2021
  • 使用simulink进行esp32开发,进行串口收发数据需要注意的地方,为什么收发不成功
  • 多周期路径的约束与设置原则
  • 【算法】反转链表
  • DevEco Studio No device 无法识别 usb 设备 - 鸿蒙
  • WebRTC API接口教程:实现高效会议的步骤?