当前位置: 首页 > news >正文

java中获取字符串中满足正则表达式的元素集合

目录

1.说明

2.从"as1285dfSWE45"中提取单个小写字母

3.从"aHs12DF85dfSWE45"中提取连续大写字母

4.从"[1024]*100-52[587] + [24$]"中提取[]中的数字

5.总结


1.说明

在开发中有时需要从字符串中提取特定的字符,如下:

从"as1285dfSWE45"中提取大写字母或者小写字母或者数字

从"[1024]*100-52[587] + [24$]"中提取[]中的数字

2.从"as1285dfSWE45"中提取单个小写字母

        String str = "as1285dfSWE45";// 正则表达式,匹配单个小写字母String regex1 = "[a-z]";// 编译正则表达式Pattern pattern1 = Pattern.compile(regex1);Matcher matcher1 = pattern1.matcher(str);// 创建一个ArrayList存储匹配结果ArrayList<String> numbers = new ArrayList<>();// 查找匹配的序列while (matcher1.find()) {// 获取匹配到的数字字符串,并添加到列表中numbers.add(matcher1.group());}System.out.println(numbers);

结果:

[a, s, d, f]

说明:

正则表达式中的[]表示匹配单个字符,里面的内容是字符组,使用-表示范围,使用^表示相反,如下:

[a-z]      // 匹配所有的小写字母[A-Z]      // 匹配所有的大写字母[a-zA-Z]   // 匹配所有的字母[A-z]      // 匹配所有的字母,同[a-zA-Z][0-9]      // 匹配所有的数字[0-9\.\-]      // 匹配所有的数字、句号、减号[ \n\f\r\t\v]  // 匹配所有的空白字符(空格、换行符、换页符、回车符、水平制表符、垂直制表符)[^0-9]   //匹配非数字字符

3.从"aHs12DF85dfSWE45"中提取连续大写字母

示例:

        String str = "aHs12DF85dfSWE45";// 正则表达式,匹配小写字母String regex1 = "[A-Z]+";// 编译正则表达式Pattern pattern1 = Pattern.compile(regex1);Matcher matcher1 = pattern1.matcher(str);// 创建一个ArrayList存储匹配结果ArrayList<String> numbers = new ArrayList<>();// 查找匹配的序列while (matcher1.find()) {// 获取匹配到的数字字符串,并添加到列表中numbers.add(matcher1.group());}System.out.println(numbers);

结果:

[H, DF, SWE]

说明:

正则表达式中,

+ 号代表前面的字符必须至少出现一次(1次或多次)。

* 号代表前面的字符可以不出现,也可以出现一次或者多次(0次、或1次、或多次)。

? 问号代表前面的字符最多只可以出现一次(0次或1次)。

所以如果要捕获到单个或者多个相连的满足条件的字符,需要使用加号。

上面示例中,使用?结果如下:

[, H, , , , D, F, , , , , S, W, E, , , ]

使用*结果如下:

[, H, , , , DF, , , , , SWE, , , ]

4.从"[1024]*100-52[587] + [24$]"中提取[]中的数字

示例1:

        String str = "[1024]*100-52[587] + [24$]";// 正则表达式,匹配小写字母String regex1 = "\\[\\d+\\]";// 编译正则表达式Pattern pattern1 = Pattern.compile(regex1);Matcher matcher1 = pattern1.matcher(str);// 创建一个ArrayList存储匹配结果ArrayList<String> numbers = new ArrayList<>();// 查找匹配的序列while (matcher1.find()) {// 获取匹配到的数字字符串,并添加到列表中numbers.add(matcher1.group());}System.out.println(numbers);

结果1:

[[1024], [587]]

说明1:

在 Java 的正则表达式中,方括号 [] 是用来定义字符集的元字符,用于指定一组可能出现在匹配位置的字符。如果你需要在正则表达式中匹配方括号本身 [],或者在字符集中匹配方括号字符,你需要对它们进行转义处理。

要在 Java 正则表达式中匹配方括号 [],可以使用反斜杠 \ 进行转义,即将它们写成 \[\]。同样,如果你要在字符集中匹配方括号字符 [],也需要进行相同的转义处理。

例如,如果你想匹配包含方括号 [] 的字符串,可以编写如下的正则表达式:

String regex = "\\[.*\\]";

在上面的例子中,\\[ 匹配左方括号 [\\] 匹配右方括号 ]. 匹配任意字符,* 表示前面的字符可以重复零次或多次。

记得在 Java 中使用正则表达式时,由于反斜杠在字符串中也是转义字符,因此需要双重转义,即使用两个反斜杠 \\ 来表示一个反斜杠。

示例2:

通过上面的方式获取到了中括号及其中的数字,并没有获取到中括号内所有的数字内容,可以通过下面的方式进行实现

        String str = "[1024]*100-52[587] + [24$]";// 正则表达式,匹配小写字母String regex1 = "\\[(\\d+)\\]";// 编译正则表达式Pattern pattern1 = Pattern.compile(regex1);Matcher matcher1 = pattern1.matcher(str);String regex2 = "\\[(\\d+)\\$\\]";// 编译正则表达式Pattern pattern2 = Pattern.compile(regex2);Matcher matcher2 = pattern2.matcher(str);// 创建一个ArrayList存储匹配结果ArrayList<String> numbers = new ArrayList<>();// 查找匹配的序列while (matcher1.find()) {// 获取匹配到的数字字符串,并添加到列表中numbers.add(matcher1.group(1));}// 查找匹配的序列while (matcher2.find()) {// 获取匹配到的数字字符串,并添加到列表中numbers.add(matcher2.group(1));}System.out.println(numbers);

结果:

[1024, 587, 24]

说明:

捕获组的说明:

在正则表达式中,括号()用来创建一个捕获组(capturing group)。捕获组允许您对匹配的子表达式进行分组,并且可以通过索引或名称来获取这些组的内容。

使用括号可以实现以下几个功能:

  1. 分组:通过括号将多个表达式分组在一起,以便对它们作为一个整体进行操作,如应用量词或其他操作符。

  2. 捕获:括号内的内容被视为一个独立的子表达式,可以通过索引(例如group(1))或名称来获取匹配的内容。

  3. 回溯引用:可以在同一个正则表达式中引用先前捕获的内容,从而实现更复杂的模式匹配。

请注意,括号本身并不匹配任何字符,而是用来指示正则表达式引擎对其中的内容进行处理。

所以,匹配之后可以通过索引方式group(1)获取捕获组中的内容。这样就可以拿到[]中的数字

5.总结

①java中反斜线的说明

在Java中,反斜杠\在字符串中被用作转义字符。转义字符指的是由反斜杠跟着一个字符组成的字符序列,表示特殊字符或控制字符。当反斜杠后面跟着某些字符时,它们会组成特定的转义序列,代表一些特殊意义的字符。常见的转义字符包括\n(换行符)、\t(制表符)、\\(反斜杠自身)、\'(单引号)和\"(双引号)等。

例如,如果你想在字符串中表示一个双引号字符",你可以使用转义字符\,即\",来告诉编译器将"视为普通字符而不是字符串结束符。

需要注意的是,因为反斜杠本身是用作转义字符的,如果要在字符串中表示一个反斜杠字符本身,则需要写成\\,即两个反斜杠。这样编译器才能正确解释反斜杠字符。

②捕获组的使用

正则表达式中的()表示匹配其中的内容,例:

(alb) 匹配a或者b

并可以听过索引方式获取满足正则表达式的()中的内容

③?  *  +在正则中的含义

http://www.lryc.cn/news/324787.html

相关文章:

  • HTTPS总结
  • Linux之基础IO
  • 【SpringSecurity】十六、OAuth2.0授权服务器、资源服务器的配置(理论部分)
  • AtCoder Beginner Contest 346
  • Arduino智能家居
  • 吴恩达2022机器学习专项课程(一) 3.3 成本函数的公式
  • Day56-LNMP架构扩展为集群模式实战精讲
  • Windows 设置多显示器显示
  • 语言模型的原理、实战与评估
  • 【Android 内存优化】Koom核心内存指标分析
  • Spring相关框架八股
  • RK3588开发笔记-v1.3.0-SDK文件系统分区添加
  • 架构评估方法相关知识总结
  • 常用ES标准
  • Http中Host,Referer,Origin和Access-Control-Allow-Origin
  • UDP实现聊天室
  • 排序算法:如冒泡排序、插入排序、选择排序、快速排序、归并排序
  • 深度学习pytorch——GPU加速(持续更新)
  • StringRedisTemplate
  • Linux cp、mv命令显示进度条
  • 在Java中使用Apache POI保留Excel样式合并多个工作簿
  • Nomachine远程黑屏通用处理方法
  • 基于51单片机数控直流电压源proteus仿真LCD显示+程序+设计报告+讲解视频
  • [Linux]文件缓冲区
  • ARM:按键中断
  • JavaScript高级(五)--柯西化函数
  • 带3090显卡的Linux服务器上部署SDWebui
  • 37、Linux中Xsync数据同步备份工具
  • 网络基础:构建你的数字世界之桥
  • Python 全栈系列236 rabbit_agent搭建