当前位置: 首页 > news >正文

SQL面试题——飞猪SQL面试 重点用户

飞猪SQL面试题—重点用户

在一些场景中我们经常听到这样的一些描述,例如20%的用户贡献了80%的销售额,或者是20%的人拥有着80%的财富,你知道这样的数据是怎么算出来的吗

数据如下,uid 是用户的id ,amount是用户的消费金额

|uid|amount|
+---+------+
|  1|    20|
|  2|    19|
|  3|  3000|
|  4|   200|
|  5|   300|
|  6|  2000|
|  7|    10|
|  8|     3|
|  9|     2|
| 10|     1|
| 11|     1|
| 12|  4000|
| 13|     5|
| 14|     5|
+---+------+

现在我们需要

  1. 计算出贡献出90%的销售额的用户
  2. 贡献出90%的销售额用户的人数占比

这里的计算逻辑就是按照用户的销售额从大到小进行累加,找到超过90的临界点,那这些用户就是我贡献出90%的销售额的用户,是重点用户。

计算出当前销售额和累计销售额的占比

首先我们计算出当前销售额和累计销售额,我们直接使用sum 窗口函数即可,这里我们没有partition by ,因为我们就是计算全部,不需要分组

select uid,amount,sum(amount)over(order by amount desc) as cur_amount,sum(amount)over() as total_amount
from amount

有了cur_amount和total_amount 计算占比就很简单了

select uid,amount,round(sum(amount)over(order by amount desc) /sum(amount)over(),2) as rate
from amount

image-20241112210024240

找到临界点

其实这个这个时候我们可以看到在第三个用户也就是用户id 为6的那一行,累计销售占比已经超过了90%,也就是94%,此时的用户id 是13、3、6,这个时候我们的问题是我们要怎么把三个用户提出来呢

一般这个时候我们有两种实现方式

  1. 排序,就像提取分组前几一样,我们通过序号小于等于多少
  2. 标志位,满足的都是true 不满足的都是false,或者满足的都是1不满足的都是0

我们这个场景很明显用排序不是那么方便,因为这里的百分比值没有准确等于90%的,跟排序不一样,所以我们用标志位,我们要的数据用true 表示,不要的用false 表示

这里我们判断true 的逻辑是

  1. rate 小于0.9
  2. 当前rate 大于等于0.9,但是前面一个rate 小于0.9,那么此时当前记录包括之前的记录都是我们需要的,当前记录就是边界
selectuid,amount,rate,if(rate<0.9 or (rate>0.9 and lag(rate,1,0)over(order by amount desc)<0.9),true,false) as flag
from(select uid,amount,round(sum(amount)over(order by amount desc) /sum(amount)over(),2) as ratefrom amount
)tmp

image-20241112212355378

我们可以看到数据是正确的,最后汇总一下

selectflag,count(1)
from(selectuid,amount,rate,if(rate<0.9 or (rate>0.9 and lag(rate,1,0)over(order by amount desc)<0.9),true,false) as flagfrom(select uid,amount,round(sum(amount)over(order by amount desc) /sum(amount)over(),2) as ratefrom amount)tmp
)
group by flag
grouping sets(flag,null)

image-20241112213635278

总共14个人中,3个人的消费占了90%的总消费额

http://www.lryc.cn/news/483160.html

相关文章:

  • Angular 和 Vue2.0 对比
  • websocket服务器(协程风格)--swoole进阶篇
  • Windows C/C++ Socket 编程
  • 计算两个结构的乘法
  • 学校服务器连接pycharm配置2
  • AI赋能电商:创新应用提升销售与用户体验
  • 详解kafka消息发送重试机制的案例
  • linux文本管理!!!
  • 软件设计师-计算机体系结构分类
  • 《基于深度学习的车辆行驶三维环境双目感知方法研究》
  • jwt用户登录,网关给微服务传递用户信息,以及微服务间feign调用传递用户信息
  • ubontu安装anaconda
  • 【Docker容器化技术】docker安装与配置、常用命令、容器数据卷、应用部署实战、Dockerfile、服务编排docker-compose、私有仓库
  • Python模拟A卷实操题
  • Leetcode 检测相邻递增子数组
  • rockylinux 8安装 gcc11.2
  • 【蓝桥等考C++真题】蓝桥杯等级考试C++组第13级L13真题原题(含答案)-奇数序列排序
  • 【AI】好用的AI记录
  • linux安装boost.python
  • AI 扩展开发者思维方式:以 SQL 查询优化为例
  • 自定义面板,高效的游戏性能分析利器
  • 【Linux进程特别篇】深度理解辨识僵尸进程和孤儿进程
  • 喜报|超维机器人荣获昇腾AI创新大赛铜奖
  • 从五种架构风格推导出HTTP的REST架构
  • vue-h5:在h5中实现相机拍照加上身份证人相框和国徽框
  • 免费HTML模板和CSS样式网站汇总
  • Mac打开time machine(时间机器)备份特殊文件
  • Qt 学习第十六天:文件和事件
  • nvm 切换 Node.js 版本
  • AI绘图最强软件stable diffusion,一文带你迅速了解!