当前位置: 首页 > news >正文

Java:正则表达式案例:爬数据,重复数据替换,数据分割

使用正则表达式查找一段文本中的内容

需求:请把下面文本中的电话,邮箱,座机号码,热线都爬取出来。

String data ="电话:1866668888,18699997777\n"+
"或者联系邮箱: boniu@itcast.cn,\n"+
"座机电话:01036517895,010-98951256\n"+
"邮箱: bozai@itcast.cn,\n"+
"邮箱2: dleiooo9@163.com,\n"+
"热线电话:400-618-9090 , 400-618-4000,4006184000,4006189090";// 1.定义爬取规则(正则表达式)
String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|"+
"(1[3-9]\\d{9}) | (O\\d{2,5}-?\\d{5,15}) | 400-? \\d{3,8}-?\\d{3,8}";// 2.把正则表达式封装成一个pattern对象
Pattern pattern = Pattern.compile(regex);//3.通过pattern对象得到查找内容的匹配器
Matcher matcher = pattern.matcher(data);//4.通过匹配器开始去内容中查找信息
while(matcher.find()){
system.out.println(matcher.group());//取出信息

正则表达式用于搜索替换、分割内容

在这里插入图片描述

搜索替换

在这里插入图片描述

分割

"\+"代表的意思是重复一次以上的数据

在这里插入图片描述

http://www.lryc.cn/news/123833.html

相关文章:

  • CF 765D Artsem and Saunders 构造
  • DevOps系列文章 之 SpringBoot整合GitLab-CI实现持续集成
  • K8S系列二:实战入门
  • form中表单切换,导致 relus 中的事件无法触发,原因:页面切换不要一直切换DOM,会导致问题,需要都显示出来
  • Android Ble蓝牙App(五)数据操作
  • .netcore grpc双向流方法详解
  • 【Servlet】(Servlet API HttpServlet 处理请求 HttpServletRequest 打印请求信息 前端给后端传参)
  • java中右移>>和无符号右移>>>的区别
  • 牛客周赛 Round 7
  • R语言生存分析(机器学习)(1)——GBM(梯度提升机)
  • k8s和docker简单介绍
  • Lua学习记录
  • 三分钟完美解决你的C盘内存过大爆红
  • C++ - equal(比较两个vector元素)
  • 多线程:线程池
  • 9.3.2.2网络原理(传输层TCP)
  • ssm+mybatis无法给带有下划线属性赋值问题
  • 学习笔记-JVM监控平台搭建
  • 使用css实现时间线布局(TimeLine)
  • 深入浅出 栈和队列(附加循环队列、双端队列)
  • 前端基础(二)
  • ORB-SLAM2学习笔记7之System主类和多线程
  • gin的占位符:和通配符*
  • 【量化课程】08_2.深度学习量化策略基础实战
  • 12-数据结构-数组、矩阵、广义表
  • Idea 反编译jar包
  • 【Git】安装以及基本操作
  • Spring创建Bean的过程(2)
  • Linux 终端操作命令(2)内部命令
  • 【Git】大大大问题之syntax error near unexpected token `(‘ 的错误解决办法