当前位置: 首页 > news >正文

Clickhouse中bitmap介绍以及计算留存Demo

前言

参考了腾迅的大数据分析-计算留存,能够根据用户自定义属性,以及玩家行为进行留存的计算。最初计算留存的方法使用的是clickhosue自带的rentention函数,使用这个函数不用关注太多细节,只需要把留存条件放入函数即可。但是这个如果需要关联用户属性,就比较麻烦了。因此参考了bitmap实现自定义留存。这里先介绍几个bitmap相关的函数。
在这里插入图片描述

测试

1亿条数据,去重计算出9千多万整形数值。

  • 非精确去重函数:uniq、uniqHLL12、uniqCombined
  • 精确去重函数:uniqExact、groupBitmap
函数时长(秒)去重后个数误差个数误差率
uniq(user_id)0.324985170623262370.33%
uniqHLL12(user_id)0.96799480495-637196-0.64%
uniqCombined(user_id)0.957986002782430210.25%
uniqExact(user_id)8.259988432990%0%</
http://www.lryc.cn/news/35760.html

相关文章:

  • 大数据是什么?学习后能找高薪工作么
  • 如何提取视频中的音频转文字?分享提效减负视频转文字方法
  • 脑机接口科普0018——前额叶切除手术
  • FPGA工程师面试——基础知识
  • 全国青少年软件编程(Scratch)等级考试一级真题——2019.12
  • 【Integrated Electronics系列——数字电子技术基础】
  • 【微信小程序】-- 页面处理总结(三十一)
  • Spring Batch使用详细例子
  • 漏洞预警|Apache Dubbo 存在反序列化漏洞
  • Tomcat源码分析-spring boot集成tomcat
  • 一个古老的html后台的模板代码
  • 支持向量回归删除异常值Python
  • 手把手开发一门程序语言JimLang (2)
  • DSF深度搜索时到底是如何回溯的(小tip)
  • Rust Web入门(八):打包发布
  • synchronize优化偏向锁
  • 算法习题之动态规划
  • 顺序表【数据结构】
  • SNAP中根据入射角和干涉图使用波段计算器计算垂直形变--以门源地震为例
  • Ubuntu20.04中Docker安装与配置
  • pytorch权值初始化和损失函数
  • maven将jar文件上传至本地仓库及私服
  • 前端学习第三阶段-第1、2章 JavaScript 基础语法
  • hibernate学习(二)
  • 平安银行LAMBDA实验室负责人崔孝林:提早拿到下一个计算时代入场券
  • linux下进不去adb
  • 【SPSS】多因素方差分析详细操作教程(附案例实战)
  • 我的投稿之旅
  • 51单片机DS18B20的使用
  • Vue组件原理知识(1)