当前位置: 首页 > news >正文

一份热乎的数据分析(数仓)面试题 | 每天一点点,收获不止一点

目录

1. 已有ods层⽤⼾表为ods_online.user_info,有两个字段userid和age,现设计数仓⽤⼾表结构如 下:

2. 设计数据仓库的保单表(⾃⾏命名)

3. 根据上述两表,查询2024年8⽉份,每⽇,业务分类1,业务分类2下的保单量和保费规模

4. 根据保单表,请写⼀段sql求⽤⼾累计投保满5000(>=5000)的投保⽇期(即⽤⼾是在哪天投保累 计满5000元)

5. 推荐表结构如下,请写⼀段sql,根据1层推荐的数据,查找所有⼈之间的推荐层级(如果A推荐B, B推荐C,则A到C就是⼆级推荐;C推荐H,则A到H就是三级推荐),并更新到表中。

~~评论区留言留下你的答案~~

6 我的专栏数分面试题

6.1 客户投保问题

6.2 异常值检测问题 

6.3  无效搜索问题 | 百度面试题

 6.4 区间分布问题

6.5 用户购买行为分析

 6.6 滴滴呼叫订单问题

 6.7 蚂蚁森林低碳生活数据分析

 6.8 快手直播间人员在线分析

6.9 京东电商购物漏斗分析 

6.10 Soul 用户活跃、留存和粘性分析

​6.11 微信-情人节红包流向探索分析

... ...

不局限于以上内容,数字化建设通关指南专栏内容更精彩!!!


1. 已有ods层⽤⼾表为ods_online.user_info,有两个字段userid和age,现设计数仓⽤⼾表结构如 下:

根据数据仓库命名规范给用户维度表命名
字段名字段类型描述
customeridstring用户唯一标识
agebigint用户年龄
age_descstring用户年龄分层(21岁到60岁,每5岁为一个间隔,例如21-25、26-30)
1.1 create :创建⽤⼾维度表(hive)
要求1,建表
要求2,保留最近7⽇分区
1.2 insert :将ods表导⼊建好的⽤⼾维度表

2. 设计数据仓库的保单表(⾃⾏命名)

(保单表)数据范围2024年8月1日至今的新短期付费保险单
字段名字段类型描述
用户唯一标识
产品ID
保单号
保费
投保日期
其他能想到的维度自行补充

3. 根据上述两表,查询2024年8⽉份,每⽇,业务分类1,业务分类2下的保单量和保费规模

4. 根据保单表,请写⼀段sql求⽤⼾累计投保满5000(>=5000)的投保⽇期(即⽤⼾是在哪天投保累 计满5000元)

参考数据如下:Mike是在1/6,John是在1/8,Lisa是在1/4
用户唯一标识保费投保日期
Mike20002024-01-01
Mike20002024-01-02
John30002024-01-02
Lisa50002024-01-04
Mike60002024-01-06
John20002024-01-08
Lisa10002024-01-08

5. 推荐表结构如下,请写⼀段sql,根据1层推荐的数据,查找所有⼈之间的推荐层级(如果A推荐B, B推荐C,则A到C就是⼆级推荐;C推荐H,则A到H就是三级推荐),并更新到表中。

推荐人被推荐人推荐层级
AB1
BC1
AD1
DE1
DF1
CH1

~~评论区留言留下你的答案~~

6 我的专栏数分面试题

6.1 客户投保问题

 数据分析面试题:客户投保问题分析-CSDN博客

6.2 异常值检测问题 

 数据分析面试题:如何分析基于绝对中位差的异常值检测问题?-CSDN博客

6.3  无效搜索问题 | 百度面试题

数据分析面试题:无效搜索问题 | 百度面试题-CSDN博客

 

 6.4 区间分布问题

数据分析面试题:如何分析区间上用户分布情况 | 基于快递单量区间划分的用户分布情况 | 基于TOPN商品区间划分用户浏览情况分析-CSDN博客

6.5 用户购买行为分析

数据分析面试题:用户购买行为及订单统计分析【巴别时代】-CSDN博客

 

 6.6 滴滴呼叫订单问题

数据分析面试题:滴滴-订单呼叫完答率分析_滴滴应答率怎么解决数据分析-CSDN博客

 

 6.7 蚂蚁森林低碳生活数据分析

数据分析面试题:蚂蚁森林低碳生活数据分析_关于低碳生活 数据分析表-CSDN博客 

 

 6.8 快手直播间人员在线分析

数据分析面试题:快手直播间人员在线分析_c# 快手直播间在线人数-CSDN博客

6.9 京东电商购物漏斗分析 

数据分析面试题:京东电商购物漏斗分析-CSDN博客

6.10 Soul 用户活跃、留存和粘性分析

数据分析面试题:Soul 用户活跃、留存和粘性分析_soul留存数据-CSDN博客 

 6.11 微信-情人节红包流向探索分析

数据分析面试题:微信-情人节红包流向探索分析_红包发送方用户的基本信息缺失率有多高?(即有多少红包发送方用户无法在用户基本信-CSDN博客

... ...

不局限于以上内容,数字化建设通关指南专栏内容更精彩!!!

当然,本文只是展示了数据分析面试题部分内容,其余的内容均在我的数字化建设通关指南专栏里,该专栏不局限于数据分析面试题,也有实战技巧的总结,和数仓建模经验的总结,具体参考如下专栏:

数字化建设通关指南_莫叫石榴姐的博客-CSDN博客

 

 

http://www.lryc.cn/news/432967.html

相关文章:

  • 3 html5之css新选择器和属性
  • 【Kubernetes】K8s 的鉴权管理(一):基于角色的访问控制(RBAC 鉴权)
  • 保研 比赛 利器: 用AI比赛助手降维打击数学建模
  • 秋招校招,在线性格测评应该如何应对
  • chrome 插件开发入门
  • 揭开面纱--机器学习
  • Python中的私有属性与方法:解锁面向对象编程的秘密
  • 开篇_____何谓安卓机型“工程固件” 与其他固件的区别 作用
  • DBeaver 连接 MySQL 报错 Public Key Retrieval is not allowed
  • 三个月涨粉两万,只因为知道了这个AI神器
  • vulhub GhostScript 沙箱绕过(CVE-2018-16509)
  • 李宏毅机器学习笔记——反向传播算法
  • 内推|京东|后端开发|运维|算法...|北京 更多岗位扫内推码了解,直接投递,跟踪进度
  • 编写Dockerfile第二版
  • 校验码:奇偶校验,CRC循环冗余校验,海明校验码
  • 增维思考,减维问题,避免焦虑!
  • 自动化抢票 12306
  • 海外云服务器安装 MariaDB10.6.X (Ubuntu 18.04 记录篇二)
  • Mybatis_基础
  • 8Manage采购申请管理:轻松实现手动采购流程自动化
  • PADS Router 入门基础教程(一)
  • 一台手机一个ip地址吗?手机ip地址泄露了怎么办
  • 【扇贝编程】使用Selenium模拟浏览器获取动态内容笔记
  • TCP Analysis Flags 之 TCP Port numbers reused
  • 【Python机器学习】核心数、进程、线程、超线程、L1、L2、L3级缓存
  • JavaScript使用地理位置 API
  • dockerfile部署fastapi项目
  • 火语言RPA流程组件介绍--浏览网页
  • 【Linux系统学习】2.Linux基础命令
  • ABAP正则表达式 特殊字符处理