当前位置: 首页 > news >正文

数仓工具—Hive语法之正则表达式函数

正则表达式函数

之前我们介绍过like rlike regexp 这些关键字,都是和匹配有关的,今天我们介绍一下hive 的REGEXP_REPLACEREGEXP_EXTRACT 函数,背景是使用Hive正则表达式函数提取数字

在我的其他文章中,我们已经看到了如何使用Hive正则表达式从字符串中提取日期值。正则表达式函数有时被称为regex。正则表达式的另一个常见用途是提取数值,例如从字符串数据中提取区号或电话号码。在本文中,我们将检查如何在Apache Hive中使用正则表达式函数提取数字。

使用Hive正则表达式函数提取数字

当您处理不同的数据源时,可能需要从给定的字符串类型列中提取数字值,如电话号码或区号。

以下正则表达式允许您获取所需的数值。

  • Hive REGEXP_REPLACE 正则表达式函数
  • Hive REGEXP_EXTRACT 正则表达式函数

现在,让我们使用这些函数从字符串类型中提取数字或数值。

使用Hive REGEXP_REPLACE提取数字

Hive REGEXP_REPLACE 函数 是获取所需值的最简单函数之一。这里的想法是用空格替换所有字母字符,除了数字或数值。

例如,考虑下面的Hive示例,用日期值替换所有字符。

sql
SELECT TRIM(REGEXP_REPLACE(string, '[^0-9]'
http://www.lryc.cn/news/399942.html

相关文章:

  • WKCTF 2024 easy_heap
  • SQL 多变关联使用子查询去重
  • php表单提交并自动发送邮件给某个邮箱(示例源码下载)
  • 论文翻译:Large Language Models for Education: A Survey
  • 7.13实训日志
  • 【力扣】每日一题—第70题,爬楼梯
  • Docker修改国内镜像源
  • 安防监控视频平台LntonCVS视频融合共享平台智慧消防实现远程集中视频监控方案
  • 【大模型LLM面试合集】大语言模型架构_layer_normalization
  • OpenGL笔记八之EBO和EBO绘制流程
  • maven——(重要)手动创建,构建项目
  • 数学建模·非线性规划
  • SpringCloud第三篇(服务中心与OpenFeign)
  • Linux重要知识点
  • Unity宏和编辑器
  • 计算机网络——网络层(概念及IP地址划分)
  • 【JVM实战篇】内存调优:内存泄露危害+内存监控工具介绍+内存泄露原因介绍
  • CVE漏洞爬虫脚本
  • 如何搭建互联网医院系统源码?医疗陪诊APP开发实战详解
  • 高通平台android的Framework开发遇到的一些问题总结
  • 基于modbus tcp通讯的雷赛导轨控制器调试软件
  • 阿里云产品流转
  • GO语言中的接口(interface)
  • 模拟电路再理解系列(2)-电源滤波电路
  • uniapp使用多列布局显示图片,一行两列
  • 近期几首小诗汇总-生活~卷
  • 超时导致SparkContext构造失败的问题探究
  • 【人工智能】Transformers之Pipeline(一):音频分类(audio-classification)
  • Nginx 负载均衡详解
  • Unity3D开发之传送带实现