当前位置: 首页 > news >正文

在python中使用正则表达式

正则表达式是什么?就是要寻找的数据的规律,使用正则表达式的步骤有三

第一,寻找规律,第二使用正则符号表示规律,第三,提取信息

看下面的代码

import re
wenzhang = ('小草偷偷地从土里钻出来,嫩嫩的,绿绿的。园子里,田野里,瞧去,密码是:200073215,一大片一大片满是的。''坐着,躺着,打两个滚,踢几脚球,赛几趟跑:27329915,一,捉几回迷藏。风轻悄悄的,草软绵绵的。')
paqumima= re.findall(':(.*),',wenzhang)
paquzhunque = re.findall(':(.*?),',wenzhang)
print(paqumima,len(paqumima))
print(paquzhunque,len(paquzhunque))

输出效果为

['200073215,一大片一大片满是的。坐着,躺着,打两个滚,踢几脚球,赛几趟跑:27329915,一,捉几回迷藏。风轻悄悄的'] 1
['200073215', '27329915'] 2

相关知识:

第一行 import re

python中正则表达式的模块就是re,所以第一行先导入模块re

第二行:wenzhang=(‘巴拉巴拉巴巴拉拉‘)

就是把要提取的文本源文件赋值给一个叫wenzhang的变量,当然这个变量名可以自己随便起。

第三行:paqumima= re.findall(':(.*),',wenzhang)

re是导入的模块,

点,findall是re模块中的一个方法,findall的使用格式是

re.findall(‘正则表达式’,这是里源文本变量)

‘正则表达式’的格式是

‘要爬取文字前面的字符(.*)要爬取文字后面的字符’

返回的值就是按正则表达式描述的内容。

这里的正则表达式是‘:(.*),’

意思就是,从源文本中找以开头的,以结尾的部分,这一部分就是用(.*)表示

其中.表示除换行符以外的任何一个字符。

*表示它前面的一个表达式0次到无限次。

但是第三行的正则表达式有个缺点就是以:开头,以最后一个,结尾,中间还爬取了好多没用的信息,所以我们用了第四行的正则表达式

第四行代码:paquzhunque = re.findall(':(.*?),',wenzhang)

除了正则表达式多了一个?外,和第三行代码一模一样,从后面输出的效果来看

正则表达式(.*?)表示每一个符合正则表达式的内容。所以后面输出的效果长度也是2,也仅仅是输出了表示密码的部分。

http://www.lryc.cn/news/405211.html

相关文章:

  • 华清数据结构day4 24-7-19
  • 【深度学习图像】拼接图的切分
  • Covalent(CXT)运营商网络规模扩大 42%,以满足激增的需求
  • Java 集合框架:HashMap 的介绍、使用、原理与源码解析
  • 单周期CPU(三)译码模块(minisys)(verilog)(vivado)
  • 理想化相机模型的相机内参
  • 【数据脱敏】⭐️SpringBoot 整合 Jackson 实现隐私数据加密
  • 骑砍2霸主MOD开发(18)-多人联机模式开发环境搭建
  • 【HZHY-AI300G智能盒试用连载体验】在华为IoTDA平台上建立设备
  • 【LLM】-05-提示工程-部署Langchain-Chat
  • 【漏洞复现】Next.js框架存在SSRF漏洞(CVE-2024-34351)
  • 【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 小区小朋友统计(100分) - 三语言AC题解(Python/Java/Cpp)
  • Vuex看这一篇就够了
  • Kafka集群创建
  • 2024.7.22 作业
  • 如何使用aiohttp或requests-async等库并发地执行多个HTTP请求
  • Golang | Leetcode Golang题解之第257题二叉树的所有路径
  • 关于css中flex布局垂直居中失效问题的原因
  • 用Redisson写一个库存扣减的方法
  • 第2节课:文本内容与格式化——HTML中的文本处理技巧
  • temu平台电池/锂电池UN38.3资质合规解析
  • Huawei、Cisco 路由中 RIP 协议 summary 的用法
  • 智能图像信息提取(飞桨OCR+ERNIE-Layout)
  • Ubuntu 24.04 LTS Noble安装 FileZilla Server
  • 【关于使用swoole的知识点整理】
  • 迁移学习:目标检测的加速器
  • gitee的怎么上传项目
  • 【HarmonyOS4学习笔记】《HarmonyOS4+NEXT星河版入门到企业级实战教程》课程学习笔记(二十三)
  • .NET C# 配置 Options
  • 42、PHP 实现把二叉树打印成多行