当前位置: 首页 > news >正文

python 爬虫篇(1)---->re正则的详细讲解(附带演示代码)

re正则的详细讲解

文章目录

  • re正则的详细讲解
    • 前言
    • 4.re正则表达式
    • (1)e正则的匹配模式
    • (2) re.search 的使用
    • (3)re.findall()的使用
    • (4)re.sub()的使用
    • 结语

前言

大家好,今天我将开始更新python爬虫篇,陆续更新几种解析数据的方法,例如 re正则表达式beautifulsoup xpath lxml 等等,以及selenium自动化的使用,scrapy 爬虫框架的使用等等. 还会写一些涉及到 js 逆向 ,验证码等等的实战项目, 大家近请期待吧!

那我们就看开始今天的学习吧!


4.re正则表达式

re正则表达式是python的内置模块,是对字符串操作的一种逻辑公式,就是用事先定义好的一些特殊字符及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种逻辑过滤。

模式描述
\w匹配字母数字及下划线
\W匹配非字母数字下划线
\s匹配任意空白字符,等价于 [\t\n\r\f].
\S匹配任意非空字符
\d匹配任意数字,等价于 [0-9]
\D匹配任意非数字
\A匹配字符串开始
\Z匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串
\z匹配字符串结束
\G匹配最后匹配完成的位置
\n匹配一个换行符
\t匹配一个制表符
^匹配字符串的开头
$匹配字符串的末尾。
.匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。
[…]用来表示一组字符,单独列出:[amk] 匹配 ‘a’,‘m’或’k’
[^…]不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
*匹配0个或多个的表达式。
+匹配1个或多个的表达式。
?匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
{n}精确匹配n个前面表达式。
{n, m}匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
a|b匹配a或b
( )匹配括号内的表达式,也表示一个组

以上是re正则表达式的匹配模式中使用的匹配符表


(1)e正则的匹配模式

1,最常规的使用

import re #导包content = 'Hello 123 456789 World_This is a Regex Demo'  # 准备好的待匹配字符串res = re.match('^Hello\s\d{3}\s\d{6}\s\w{10}.*Demo$',content)
a = re.match(&#
http://www.lryc.cn/news/294952.html

相关文章:

  • (超详细)10-YOLOV5改进-替换CIou为Wise-IoU
  • Java-并发高频面试题-2
  • Windows安装Redis
  • Nicn的刷题日常之 有序序列判断
  • 1、将 ChatGPT 集成到数据科学工作流程中:提示和最佳实践
  • vite+vue3发布自己的npm组件+工具函数
  • 嵌入式软件bug分析基本要求
  • 【C/C++ 17】继承
  • 解决Linux Shell脚本错误:“/bin/bash^M: bad interpreter: No such file or directory”
  • idea创建spring项目
  • 【UE 材质】扇形材质
  • 【react native】ScrollView的触摸事件与TouchableWithoutFeedback的点击事件冲突
  • 鸿蒙内核框架
  • 幻兽帕鲁专用服务器,多人游戏(专用服务器)搭建
  • 7000字详解Spring Boot项目集成RabbitMQ实战以及坑点分析
  • AJAX-认识URL
  • 国图公考:公务员面试资格复审需要准备什么?
  • 爬虫实战--人民网
  • 【Arduino】LGT8F328 UNO R3编译上传
  • Python进阶----在线翻译器(Python3的百度翻译爬虫)
  • ArcGISPro中Python相关命令总结
  • 2024年混合云:趋势和预测
  • c++入门学习④——对象的初始化和清理
  • Java-spring注解的作用
  • Allegro如何把Symbols,shapes,vias,Clines,Cline segs等多种元素一起移动
  • 【力扣】罗马数字转整数,哈希集合+模拟
  • 从长网址到短链接:探索网址缩短的神奇世界
  • Micro micro controller一览
  • 一文简介Maven初级使用
  • Django的配置文件setting.py