当前位置: 首页 > news >正文

SQL分组问题

下列为电商公司用户访问时间数据

统计某个用户连续的访问记录,如果时间间隔小于60s,就分为一组

id       ts

1001 17523641234

1001 17523641256

1002 17523641278

1001 17523641334

1002 17523641434

1001 17523641534

1001 17523641544

1002 17523641634

1001 17523641638

1001 17523641654

id       ts           group

1001 17523641234       1

1001 17523641256       1

1001 17523641334       2

1001 17523641534       3

1001 17523641544       3

1001 17523641638       4

1001 17523641654       4

1002 17523641278       1

1002 17523641434       2

1002 17523641634       3

2. 需求:

① 创建表

② 统计每个用户连续的访问记录中,如果时间间隔小于60s,就分为一个组(观察数是标准的时间戳吗?)

3. 数据准备:

编辑文件user_visit.txt

[atguigu@hadoop102 ~]$ vim /opt/module/hive/datas/user_visit.txt

1001 17523641234

1001 17523641256

1002 17523641278

1001 17523641334

1002 17523641434

1001 17523641534

1001 17523641544

1002 17523641634

1001 17523641638

1001 17523641654

select id, ts, sum(flag) over (partition by id order by ts) as id_group
from
(select id, ts, lag_ts, (ts - lag_ts) as diff, if((ts - lag_ts) < 60, 0, 1) as flag from(select id, ts,lag(ts, 1, 0) over (partition by id order by ts) as lag_tsfrom test2) tb1
)tb2

http://www.lryc.cn/news/546276.html

相关文章:

  • Oracle 数据库基础入门(二):深入理解表的约束
  • DeepSeek掘金——DeepSeek-R1驱动的房地产AI代理
  • WebP2P技术在嵌入式设备中的应用:EasyRTC音视频通话SDK如何实现高效通信?
  • 【零基础到精通Java合集】第三集:流程控制与数组
  • VsCode + EIDE + OpenOCD + STM32(野火DAP) 开发环境配置
  • 【vue-echarts】——01.认识echarts
  • 【http://noi.openjudge.cn/】4.3算法之图论——1538:Gopher II
  • Linux常见操作命令
  • Linux下测试Wifi性能——2.Linux下wifi指令
  • (十 九)趣学设计模式 之 中介者模式!
  • Leetcode 54: 螺旋矩阵
  • abseil-cpp:环境搭建
  • Centos7部署k8s(单master节点安装)
  • RPA 职业前景:个人职场发展的 “新机遇”
  • 详解DeepSeek模型底层原理及和ChatGPT区别点
  • 《2025年软件测试工程师面试》JAVA基础面试题
  • 【算法学习之路】5.贪心算法
  • 如何打造一个安全稳定的海外社媒账号?
  • 【Python 数据结构 5.栈】
  • Qt开发⑪Qt网络+Qt音视频_使用实操
  • JavaEE--计算机是如何工作的
  • API接口:企业名称、注册号、统一社会信用代码、企业类型、成立日期和法定代表人等数据 API 接口使用指南
  • 微信小程序text组件decode属性的小问题
  • 【计算机网络入门】初学计算机网络(九)
  • LeetCode 974:和可被 K 整除的子数组
  • vector习题
  • 001-码云操作
  • 数据结构:二叉搜索树(排序树)
  • 【愚公系列】《Python网络爬虫从入门到精通》036-DataFrame日期数据处理
  • C++(蓝桥杯常考点)