当前位置: 首页 > news >正文

Redis之UV统计

HyperLogLog

首先我们搞懂两个概念:

  • UV:全称Unique Visitor,也叫独立访客量,是指通过互联网访问、浏览这个网页的自然人。1天内同一个用户多次访问该网站,只记录1次。
  • PV:全称Page View,也叫页面访问量或点击量,用户每访问网站的一个页面,记录1次PV,用户多次打开页面,则记录多次PV。往往用来衡量网站的流量。

通常来说UV会比PV大很多,所以衡量同一个网站的访问量,我们需要综合考虑很多因素,所以我们只是单纯的把这两个值作为一个参考值

UV统计在服务端做会比较麻烦,因为要判断该用户是否已经统计过了,需要将统计过的用户信息保存。但是如果每个访问的用户都保存到Redis中,数据量会非常恐怖,那怎么处理呢?

Hyperloglog(HLL)是从Loglog算法派生的概率算法,用于确定非常大的集合的基数,而不需要存储其所有值。相关算法原理大家可以参考:HyperLogLog 算法的原理讲解以及 Redis 是如何应用它的 - 掘金 Redis中的HLL是基于string结构实现的,单个HLL的内存永远小于16kb内存占用低的令人发指!作为代价,其测量结果是概率性的,有小于0.81%的误差。不过对于UV统计来说,这完全可以忽略。

测试百万数据的统计

测试思路:我们直接利用单元测试,向HyperLogLog中添加100万条数据,看看内存占用和统计效果如何

 @Resourceprivate StringRedisTemplate stringRedisTemplate;@Testpublic void test3(){// 准备数组,装用户数据String[] users = new String[1000];// 数组索引int index=0;for (int i = 1; i <= 1000000; i++) {// 赋值users[index++]="user_"+i;// 每1000条发送一次if (i % 1000 == 0){index=0;stringRedisTemplate.opsForHyperLogLog().add("hll1",users);}}// 统计数量Long size = stringRedisTemplate.opsForHyperLogLog().size("hll1");System.out.println("size= " + size);}

经过测试:我们会发生他的误差是在允许范围内,并且内存占用极小

http://www.lryc.cn/news/199900.html

相关文章:

  • sqlserver数据库,创建作业,定时执行sql
  • 计算机缺失d3dcompiler_47.dll解决方案,如何修复电脑缺失d3d文件
  • 计算机视觉开源代码汇总
  • 【C语言必知必会 | 子系列第六篇】深入剖析循环结构(2)
  • 华为ICT——云计算基础知识、计算类技术听课笔记
  • PyTorch入门教学——TensorBoard使用
  • 03 里氏替换原则
  • 【微信小程序】无纸化会议OA系统之首页搭建
  • 小程序:uniapp解决主包体积过大的问题
  • [opencv]图像和特征点旋转
  • 世界粮食日:宏工科技有对策,赋能食品生产高效可持续发展
  • FutureTask配合Thread实现处理有返回结果的源码、逻辑与架构分析
  • Queue Deque 介绍
  • 机器学习(23)---Boosting tree(课堂笔记)
  • Excel 导出打不开
  • css钟表数字样式
  • 一步一步分析ChatGPT,1 粘性,2 传染性, 3 双边网络效应
  • Arthas(阿尔萨斯):阿里巴巴开源的线上问题诊断工具
  • 由Django-Session配置引发的反序列化安全问题
  • 16-spring AOP核心对象的创建
  • Golang 泛型的介绍
  • RK3568笔记四:基于TensorFlow花卉图像分类部署
  • 甄知科技张礼军:数智化转型助企业破茧成蝶!
  • Golang Map:高效的键值对容器
  • 2023年【电工(高级)】报名考试及电工(高级)模拟考试题
  • 伊朗相关的OilRig组织在为期8个月的网络攻击中针对中东政府
  • 服务器数据恢复-linux+raid+VMwave ESX数据恢复案例
  • 残疾人求助报警器
  • 【Datawhale】扩散模型学习笔记 第一次打卡
  • Spring Boot学习笔记