当前位置: 首页 > news >正文

Oracle系列之十:Oracle正则表达式

Oracle正则表达式

  • 1. 基本语法
  • 2. POSIX字符类
  • 3. 正则表达式函数
  • 4. 常用正则表达式

正则表达式 (Regular expression) 是一种强大的文本处理工具,Oracle数据库自9i版本开始引入了正则表达式支持,可帮助开发者快速而准确地匹配、查找和替换字符串,广泛应用于数据查询、数据分析、数据清洗等领域。

1. 基本语法

Oracle正则表达式的语法基于Perl语言的正则表达式语法,区分大小写(case sensitive)。

(1)字符匹配

  • .:匹配除了换行外的任意一个字符;
  • \d:匹配任何数字,相当于 [0-9];
  • \D:匹配任何非数字字符,相当于 [^0-9];
  • \w:匹配任何字母数字字符或下划线,相当于 [a-zA-Z0-9_];
  • \W:表示匹配任何非字母数字字符或下划线,相当于 [^a-zA-Z0-9_]。

(2)限定符

  • *:匹配前一个字符出现0次或多次;
  • +:匹配前一个字符出现1次或多次;
  • ?:匹配前一个字符出现0次或1次;
  • {n}:匹配前一个字符出现n次;
  • {n,}:匹配前一个字符出现n次或更多;
  • {n,m}:匹配前一个字符出现n~m次。

'|' :指两项之间的一个选择。

e.g.

^([a-z]+|[0-9]+)$:表示所有小写字母或数字组合成的字符串。

(3)边界匹配

  • ^:匹配开始位置;
  • $:匹配结束位置;
  • \b:匹配单词边界,即单词的开头或结尾位置;
  • \B:匹配非单词边界,即不是单词的开头或结尾位置。

(4)分组和引用

  • ():分组,标记一个子表达式的开始和结束位置;
  • \num:引用第num个子表达式,num从1开始。

(5)字符集合

  • []:表示一组字符中的任意一个。

(6)转义符

  • \\:表示转义一个字符。

oracle正则表达式还支持一些高级语法,例如贪婪匹配、非贪婪匹配、零宽断言(zero-width assertion)、后向引用(backreference)、捕获组等。

2. POSIX字符类

Oracle数据库中的POSIX字符类是一组特殊的字符类,用于在正则表达式中匹配特定的字符。

POSIX字符类以 [: 开头,以 :] 结尾,中间包含一个或多个字符,代表特定的字符集合。POSIX字符类中的字符集合可以是预定义的,也可以是自定义的。

  • [[:alpha:]] 任何字母,等同于字符集合 [a-zA-Z];
  • [[:digit:]] 任何数字,等同于字符集合 [0-9];
  • [[:alnum:]] 任何字母和数字,等同于字符集合 [a-zA-Z0-9];
  • [[:space:]] 任何白字符;
  • [[:upper:]] 任何大写字母;
  • [[:lower:]] 任何小写字母;
  • [[:punct:]] 任何标点符号;
  • [[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]。

Oracle数据库中,POSIX字符类可以用于各种正则表达式相关的操作,如模式匹配、替换、分割等。由于Oracle数据库中的POSIX字符类与其他数据库或编程语言中的POSIX字符类可能略有不同,具体使用时需要查看相关文档。

3. 正则表达式函数

Oracle数据库提供了多种正则表达式函数,可以对文本数据进行匹配、替换等操作。

  • REGEXP_LIKE: 判断字符串是否匹配指定的正则表达式。

e.g. 查询员工名字以"S"开头,以"n"结尾的记录:

SELECT * FROM emp WHERE REGEXP_LIKE(emp_name, '^S.*n$');
  • REGEXP_REPLACE: 替换字符串中的子串。

e.g. 将字符串"12345"中连续的三个数字替换成星号"*",输出
“*45”:

SELECT REGEXP_REPLACE('12345', '\d{3}', '*') FROM dual;
  • REGEXP_SUBSTR: 提取字符串中匹配指定正则表达式的子串。

e.g. 从字符串"abc 123 def"中提取出连续的数字"123":

SELECT REGEXP_SUBSTR('abc 123 def', '\d+') FROM dual;
  • REGEXP_INSTR: 返回字符串中匹配指定正则表达式的子串的位置。

e.g. 返回字符串"1ab2cd3ef"中第一个连续数字的起始位置,即1

SELECT REGEXP_INSTR('1ab2cd3ef', '\d+') FROM dual;

4. 常用正则表达式

-- 查询value中不是纯数字的记录
select * from employee where not regexp_like(value,'^[[:digit:]]+$');
-- 查询value中不包含任何数字的记录。
select * from employee where regexp_like(value,'^[^[:digit:]]+$');
--查询所有包含小写字母或者数字的记录。
select * from employee where regexp_like(value,'^([a-z]+|[0-9]+)$');
-- 提取字符串中的数字
create or replace function EXTRACT_NUMBER(STR in varchar2) return varchar2 isPOSITION number;STR_EXT varchar2(800);STR_TMP varchar2(800);result  varchar2(800);
beginSTR_EXT:=STR;POSITION:=1;LOOPSTR_TMP:=REGEXP_SUBSTR(STR_EXT,'([0-9]+)',POSITION);result:=result||STR_TMP;STR_EXT:= SUBSTR(STR_EXT,POSITION+LENGTH(STR_TMP),LENGTH(STR));POSITION:=regexp_instr(STR_EXT,'([0-9]+)',1);exit when POSITION is null or POSITION=0;end loop;return(result);
end EXTRACT_NUMBER;
http://www.lryc.cn/news/299223.html

相关文章:

  • php基础学习之运算符(重点在连接符和错误抑制符)
  • 【CC工具箱1.2.0】更新_免费无套路,60+个工具,原码放出
  • Java 将TXT文本文件转换为PDF文件
  • Sketch 99.1 for macOS
  • Apache 神禹(shenyu)源码阅读(一)——Admin向Gateway的数据同步(Admin端)
  • Prompt Tuning:深度解读一种新的微调范式
  • Unity3d Shader篇(五)— Phong片元高光反射着色器
  • sql求解连续两个以上的空座位
  • 【链表】-Lc146-实现LRU(双向循环链表)
  • MYSQL学习笔记:MYSQL存储引擎
  • Bitcoin Bridge:治愈还是诅咒?
  • Netty应用(七) 之 Handler Netty服务端编程总结
  • LeetCode、1268. 搜索推荐系统【中等,前缀树+优先队列、排序+前缀匹配】
  • 计算机视觉基础:矩阵运算
  • Gateway中Spring Security6统一处理CORS
  • 突破编程_C++_基础教程(输入、输出与文件)
  • UE的 HUD 类中的必备方法和属性
  • 单片机的认识
  • 转发:udig安装 用来为geoserver上shp地图配置显示样式 颜色
  • Linux--常用命令(详解)
  • SouthLeetCode-打卡24年02月第1周
  • vscode的cmake工具小三角符号旁边没有目标的解决方法
  • Servlet JSP-Eclipse安装配置Maven插件
  • os模块
  • 【C语言进阶】深度剖析数据在内存中的存储--上
  • 【doghead】VS2022 win11 安装配置WSL2 以编译linux端的cmake项目并运行2
  • 【教程】C++语言基础学习笔记(七)——Array数组
  • BUGKU-WEB GET
  • 蓝桥杯每日一题----唯一分解定理
  • openssl3.2 - osslsigncode工程的学习