当前位置: 首页 > news >正文

hive和presto的求数组长度函数区别及注意事项

1、任务

获取邮箱字符串’@'后字符串 ,求长度

2、hive & spark-sql 求数组长度的函数 size


hive & spark-sql 求数组长度的函数 sizeselect size(split(email, '@')),split(email, '@'),split(email, '@')[0],split(email, '@')[1]
FROM 
(select "jack@126.com" as email union select "tom@126.com.cn" as email) tb_mid;select size(split(email, '@')),split(email, '@'),split(email, '@')[0],split(email, '@')[1]
FROM 
(select 'jack@126.com' as email union select 'tom@126.com.cn' as email) tb_mid;2	["tom","126.com.cn"]	tom	126.com.cn
2	["jack","126.com"]	jack	126.com
Time taken: 0.723 seconds, Fetched 2 row(s)

3、presto  求数组长度的函数 cardinality

presto  求数组长度的函数 cardinalityselect cardinality(split(email, '@')),split(email, '@'),split(email, '@')[1],split(email, '@')[2]
FROM 
(select 'jack@126.com' as email union select 'tom@126.com.cn' as email) tb_mid;_col0 |       _col1       | _col2 |   _col3    
-------+-------------------+-------+------------2 | [tom, 126.com.cn] | tom   | 126.com.cn 2 | [jack, 126.com]   | jack  | 126.com    
(2 rows)select cardinality(split(email, '@')),split(email, '@'),split(email, '@')[1],split(email, '@')[2]
FROM 
(select "jack@126.com" as email union select "tom@126.com.cn" as email) tb_mid;Query 20231019_070945_20009_n9u2s failed: line 3:9: Column 'jack@126.com' cannot be resolved
select cardinality(split(email, '@')),split(email, '@'),split(email, '@')[1],split(email, '@')[2]
FROM
(select "jack@126.com" as email union select "tom@126.com.cn" as email) tb_mid

4、注意事项

1)、在计算数组长度的时候,hive和presto的函数不同
  其中hive的size函数默认数组的下标从0开始
  presto的cardinality函数默认数组的下标从1开始

2)、presto 不支持双引号 ,而hive 既支持单引号,也支持双引号

presto> SELECT -> email,-> (case when cardinality(split(email, '@')) = 2 then split(email, '@')[1] else '' end ) as email_suffix-> FROM -> (select "jack@126.com" as email union select "tom@126.com.cn" as email) tb_mid;
Query 20231016_070153_17958_p9f2s failed: line 5:9: Column 'jack@126.com' cannot be resolved
SELECT
email,
(case when cardinality(split(email, '@')) = 2 then split(email, '@')[1] else '' end ) as email_suffix
FROM
(select "jack@126.com" as email union select "tom@126.com.cn" as email) tb_mid

http://www.lryc.cn/news/204184.html

相关文章:

  • Kotlin Lambda表达式与标准库中的高阶函数
  • 【JavaEE初阶】 CAS详解
  • Docker镜像制作
  • v-on 可以监听多个方法吗?
  • 【Docker】Docker Compose的使用
  • 2023年中国调速器产量、销量及市场规模分析[图]
  • 深入了解JVM调优:解锁Java应用程序性能的秘诀
  • [java进阶]——线程池的使用,自定义线程池
  • Linux 进程切换与命令行参数
  • Python基础入门例程6-NP6 牛牛的小数输出
  • 传奇游戏常见问题解决办法
  • 2310D的dll问题
  • 包管理工具
  • Qt第六十五章:自定义菜单栏的隐藏、弹出
  • element table中嵌套el-select 无法选择问题
  • 2.6.C++项目:网络版五子棋对战之数据管理模块-游戏房间管理模块的设计
  • 计算机视觉中的数据预处理与模型训练技巧总结
  • GeoHash分享
  • 【超详细】CentOS 7安装MySQL 5.7【安装及密码配置、字符集配置、远程连接配置】
  • Elasticsearch 8.X 分词插件版本更新不及时解决方案
  • Delete `␍`eslintprettier/prettier
  • 4种实用的制作URL 文件的方法
  • css总结
  • [C语言]排序的大乱炖——喵喵的成长记
  • Docker 网络与Cgroup资源限制
  • D - United We Stand
  • 【1.总纲】
  • I/O模型之非阻塞IO
  • 2023版 STM32实战11 SPI总线读写W25Q
  • Spring Security认证源码解析(示意图)