当前位置: 首页 > news >正文

2023.11.16-hive sql高阶函数lateral view,与行转列,列转行

目录

0.lateral view简介

1.行转列

 需求1:

需求2:

2.列转行

解题思路:


0.lateral view简介

  hive函数 lateral view 主要功能是将原本汇总在一条(行)的数据拆分成多条(行)成虚拟表,再与原表进行笛卡尔积,从而得到明细表。配合UDTF函数使用,一般情况下经常与explode函数搭配,explode的操作对象(列值)是 ARRAY 或者 MAP ,可以通过 split 函数将 String 类型的列值转成 ARRAY 来处理。

炸裂函数配合侧视图使用如下
格式:select 原表别名.字段名,侧视图名.字段名 from 原表 原表别名 lateral view explode(要炸开的字段) 侧视图名 as 字段名 ;

1.行转列

-- 数据准备

--建表

create table row2col2(col1 string,col2 string,col3 int)row format delimited fields terminated by '\t';

--加载数据到表中

load data inpath '/input/r2c2.txt' into table row2col2;

-- 验证数据

select * from row2col2;

 需求1:


需求1: 把原表数据变成以下格式
a b [1,2,3]
c d [4,5,6]


思路:使用collect_list()函数有序不去重


selectcol1,col2,collect_list(col3) -- 先将col3收集
from row2col2
group bycol1, col2;

需求2:


需求2: 把原表数据变成以下格式
a b '1-2-3'
c d '4-5-6'

思路:1,2,3已经知道怎么收集了,可以用concat来将这几个数字与符号-拼接起来
concat_ws():函数在连接字符串的时候,只要有一个字符串不是NULL,就不会返回NULL。concat_ws():函数需要指定分隔符。
但concat_ws只支持拼接字符串,所以需要先用cast强转成字符串

  • cast(内容 as  类型)
  • concat_ws的格式:  select concat_ws('要拼接的分隔符','字符串1','字符串2');
select col1,col2,concat_ws('-',(collect_list(cast(col3 as string))))
from row2col2
group by col1, col2
;

2.列转行

1.准备数据

--创建表
create table col2row2(col1 string,col2 string,col3 string
)row format delimited fields terminated by '\t';

2.加载数据

--加载数据
load data  inpath '/source/c2r2.txt' into table col2row2;

3.验证数据

select * from col2row2;

解题思路:

-- 单列数据先切割再炸开
-- explode只能炸一个参数,只能接收数组或映射作为参数
select explode(col3)from col2row2; --报错
--无法直接炸col3字段,因为是字符串类型,并且题中的1,2,3并不是'一个'参数select split(col3,',') from col2row2;
--用split切割后,会将切割完的数据放进数组里 [""1"",""2"",""3""][""4"",""5"",""6""]select explode(split(col3,',')) from col2row2;
--得到了数组后,可以用explode来炸了

使用lateral view生成最终的表

格式:select 原表别名.字段名,侧视图名.字段名 from 原表 原表别名 lateral view explode(要炸开的字段) 侧视图名 as 字段名 ;

select col2row2.col1 , col2row2.col2 ,c2r.col3_explode
from col2row2
lateral view
explode(split(col3,',')) c2r as col3_explode  --用lv函数造出虚拟表c2r,col3_explode是字段名
;

http://www.lryc.cn/news/231589.html

相关文章:

  • 解决Jetson Xavier NX上Invalid CUDA ‘--device 0‘ requested等问题
  • git push 报错 The requested URL returned error: 500
  • 应用软件安全编程--17预防基于 DOM 的 XSS
  • 【FastCAE源码阅读9】鼠标框选网格、节点的实现
  • 【ArcGIS处理】行政区划与流域区划间转化
  • Session、Token、Jwt三种登录方案介绍
  • Linux操作系统使用及C高级编程-D5Linux shell命令(进程管理、用户管理)
  • 【TDSQL-PG数据库简单介绍】
  • 【文件包含】metinfo 5.0.4 文件包含漏洞复现
  • 差分信号的末端并联电容到底有什么作用?
  • pandas教程:GroupBy Mechanics 分组机制
  • 通过右键用WebStorm、Idea打开某个文件夹或者在某一文件夹下右键打开当前文件夹用上述两个应用
  • Android 10.0 framework层设置后台运行app进程最大数功能实现
  • 如何快速找到华为手机中下载的文档
  • iceoryx(冰羚)-Architecture
  • LeetCode2-两数相加
  • css 灰质彩色的边框
  • OpenCV实现手势音量控制
  • pytorch 深度学习之余弦相似度
  • Postman的常规断言/动态参数断言/全局断言
  • ruoyi若依前端请求接口超时,增加响应时长
  • 贪吃蛇小游戏
  • cocos----1
  • 第十九章绘图
  • rpmbuild 包名 version 操作系统信息部分来源 /etc/rpm/macros.dist
  • 【Linux专题】SFTP 用户配置 ChrootDirectory
  • openssl+ DES开发实例(Linux)
  • 结构体几种实用的用法
  • React Native 源码分析(四)—— TurboModules JSI通信机制
  • 【C#学习】ToString() 格式化数值