当前位置: 首页 > news >正文

大数据-hive函数与mysql函数的辨析及练习-将多行聚合成一行

目录

1. 🥙collect_list: 聚合-不去重

2. 🥙collect_set(col): 聚合-去重

3. 🥙mysql的聚合函数-group_concat

4. leetcode练习题


1. 🥙collect_list: 聚合-不去重

将组内的元素收集成数组 不会去重

2. 🥙collect_set(col): 聚合-去重

函数只接受基本数据类型,它的主要作用是将某字段的值进行去重汇总,产生 Array 类型字段。

//创建一张实验用表,存放用户每天点播视频的记录
create table t_visit_video (username string,video_name string
) partitioned by (day string)
row format delimited fields terminated by ',';//创建visit.txt数据文件
张三,大唐双龙传
李四,天下无贼
张三,神探狄仁杰
李四,霸王别姬
李四,霸王别姬
王五,机器人总动员
王五,放牛班的春天
王五,盗梦空间//导入数据
load data local inpath '/opt/testDemo/visit.txt' into table t_visit_video partition (day='20180516');

 1)按用户分组,取出每个用户每天看过的所有视频的名字(不去重)

select username,collect_list(video_name)
from t_visit_video
group by username;

结果:

2)按用户2)分组,取出每个用户每天看过的所有视频的名字(去重)

select username,collect_set(video_name)
from t_visit_video
group by username;

结果:

3. 🥙mysql的聚合函数-group_concat

GROUP_CONCAT([DISTINCT] 要连接的字段 [Order BY ASC/DESC 排序字段] [Separator ‘分隔符’])
将结果集中的多行结果连接成一个字符串-- group_concat对于收集的字段只能是string,varchar,char类型  
--当不指定分隔符的时候,默认使用 ','
//创建一张实验用表,存放用户每天点播视频的记录
create table t_visit_video (
username varchar(20),
video_name varchar(20)
);//插入数据
insert into t_visit_video values
('张三','大唐双龙传'),
('李四','天下无贼'),
('张三','神探狄仁杰'),
('李四','霸王别姬'),
('李四','霸王别姬'),
('王五','机器人总动员'),
('王五','放牛班的春天'),
('王五','盗梦空间');

3)按用户分组,取出每个用户每天看过的所有视频的名字(不去重)

select username,group_concat(video_name)
from t_visit_video
group by username;

结果:

 4)按用户分组,取出每个用户每天看过的所有视频的名字(去重)

select username,group_concat(distinct video_name)
from t_visit_video
group by username;

5)按用户分组,取出每个用户每天看过的所有视频的名字(去重,用;分割视频名字)

select username,group_concat(distinct video_name separator ';')
from t_visit_video
group by username;

结果:

6)按用户分组,取出每个用户每天看过的所有视频的名字(去重,用;分割视频名字,并将视频名字按照字典顺序降序排序) 

select username,group_concat(distinct video_name order by video_name desc separator ';')
from t_visit_video
group by username;

结果:

4. leetcode练习题

leetcode 1484:按日期分组销售产品

http://www.lryc.cn/news/278378.html

相关文章:

  • 【AI视野·今日NLP 自然语言处理论文速览 第七十三期】Tue, 9 Jan 2024
  • vue知识-03
  • 关于httpClient 使用的注意事项
  • Docker 发布自定义镜像到公共仓库
  • 程序员有哪些接单的渠道?
  • 服务容错-熔断策略之断路器hystrix-go
  • C++进阶(三)多态
  • 大众汽车宣布将ChatGPT,批量集成在多种汽车中!
  • React----函数组件和类组件
  • Kafka集群部署 (KRaft模式集群)
  • Vue 自定义仿word表单录入之日期输入组件
  • Oracle与Java JDBC数据类型对照
  • C++力扣题目226--翻转二叉树
  • Gorm 数据库表迁移与表模型定义
  • 系列三、Spring Security中自定义用户名/密码
  • 如何顺滑使用华为云编译构建平台?
  • 查看Linux磁盘空间
  • 2023年全国职业院校技能大赛(高职组)“云计算应用”赛项赛卷⑩
  • vim基本操作命令
  • mybatis-plus实现真正的批量插入
  • pytorch12:GPU加速模型训练
  • P1603 斯诺登的密码题解
  • YOLOv8 + openVINO 多线程数据读写顺序处理
  • 端到端自动驾驶
  • Developer Tools for Game Creator 1
  • 软件测试|好用的pycharm插件推荐(三)——Rainbow Brackets
  • MyBatisPlus学习二:常用注解、条件构造器、自定义sql
  • 深入理解C#中的引用类型、引用赋值以及 `ref` 关键字
  • 【算法提升】LeetCode每五日一总结【01/01--01/05】
  • linux下驱动学习—平台总线 (3)