当前位置: 首页 > news >正文

hive高频使用的拼接函数及“避坑”

hive高频使用的拼接函数及“避坑”

说到拼接函数应用场景和使用频次还是非常高,比如一个员工在公司充当多个角色,我们在底层存数的时候往往是多行,但是应用的时候我们通常会只需要一行,角色字段进行拼接,这样join其他表的时候呢也不会造成数据被重复引用计算。

1、拼接多个字符串concat_null(…)

从上图中的说明中我们可以看到,在应用场景中,通常使用concat_null(…)防止由于有null存在导致的拼接异常。

2. 用分隔符拼接多个字符串concat_ws(…)

需要注意的是concat_ws(…)可以直接处理掉null,而且如果将sep分割符使用’'(空值),则功能和concat_null(…)一样。

3、collect_set、collect_list实现列转行

由于collect_set在实现列转行的时候进行了去重处理,自然实际应用中应用的也会更多。

4、“避坑” null和非字符串字段

由于在实际生产环境中,我们所使用的引擎有所不同,兼容性也不同。有时候NULL和非字符串字段在查询时也会出现问题。

1、通常我们可以把null进行替换。if(字段名 is null,‘’,字段名)

2、非字符串转化为字符串 cast(字段名 as string)

`SELECT  id,     concat_ws(',',collect_set(         cast(if(角色 is null,'',角色) as string)         )) AS `角色`    -- 将每个id对应多个的角色去重组合放到一行,并使用英文','分隔角色   
FROM emp   WHERE dt = '20230618'   GROUP BY 1   `
http://www.lryc.cn/news/129543.html

相关文章:

  • windows ipv4 多ip地址设置,默认网关跃点和自动跃点是什么意思?(跃点数)
  • java_免费文本翻译API_小牛翻译
  • flink消费kafka数据,按照指定时间开始消费
  • 【SpringCloud】Feign使用
  • WebApIs 第五天
  • 按斤称的C++散知识
  • C++策略模式
  • 如何在网页下载腾讯视频为本地MP4格式
  • opencv-yolov8-目标检测
  • CRYPTO 密码学-笔记
  • 基于YOLOv8模型的五类动物目标检测系统(PyTorch+Pyside6+YOLOv8模型)
  • Java课题笔记~ SpringBoot基础配置
  • vue实现文件上传,前后端
  • OJ练习第151题——克隆图
  • keepalived+lvs实现高可用
  • 【Let‘s make it big】英语合集61~70
  • python实现图像的二分类
  • 8.深浅拷贝和异常处理
  • Element Plus el-table 数据为空时自定义内容【默认为 No Data】
  • 使用nginx和frp实现高效内网穿透:简单配置,畅通无阻
  • Python土力学与基础工程计算.PDF-螺旋板载荷试验
  • 低代码开发ERP:精打细算,聚焦核心投入
  • 顺序表(数据结构)
  • stable_diffusion_webui docker环境配置
  • 【Java】常见面试题:HTTP/HTTPS、Servlet、Cookie、Linux和JVM
  • 批量爬虫采集完成任务
  • intelij idea 2023 创建java web项目
  • 【论文笔记】基于指令回译的语言模型自对齐-MetaAI
  • MySQL和MariaDB的版本对应关系
  • Python数据的输入与输出