当前位置: 首页 > news >正文

【从零学习python 】68. Python正则表达式中的贪婪和非贪婪模式

文章目录

    • 贪婪和非贪婪模式
    • 进阶案例

贪婪和非贪婪模式

Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;

非贪婪则相反,总是尝试匹配尽可能少的字符。

*?+{m,n}后面加上?使贪婪变成非贪婪。

s = "This is a number 234-235-22-423"
r = re.match(".+(\d+-\d+-\d+-\d+)", s)
r.group(1)  # '4-235-22-423'
r = re.match(".+?(\d+-\d+-\d+-\d+)", s)
r.group(1)  # '234-235-22-423'

正则表达式模式中使用到通配字,那它在从左到右的顺序求值时,会尽量“抓取”满足匹配最长字符串,在我们上面的例子里面,.+会从字符串的启始处抓取满足模式的最长字符,其中包括我们想得到的第一个整型字段的中的大部分,\d+只需一位字符就可以匹配,所以它匹配了数字4,而.+则匹配了从字符串起始到这个第一位数字4之前的所有字符。

re.match(r"aa(\d+)","aa2343ddd").group(1)  # '2343'
re.match(r"aa(\d+?)","aa2343ddd").group(1)  # '2'
re.match(r"aa(\d+)ddd","aa2343ddd").group(1)  # '2343'
re.match(r"aa(\d+?)ddd","aa2343ddd").group(1)  # '2343'

练习:

字符串为:

<img data-original="https://rpic.douyucdn.cn/appCovers/2016/11/13/1213973_201611131917_small.jpg" src="https://rpic.douyucdn.cn/appCovers/2016/11/13/1213973_201611131917_small.jpg" style="display: inline;">

请提取url地址

参考答案

re.search(r"https://.*?\.jpg", test_str)

进阶案例

【Python】Python 实现猜单词游戏——挑战你的智力和运气!

【python】Python tkinter库实现重量单位转换器的GUI程序

【python】使用Selenium获取(2023博客之星)的参赛文章

【python】使用Selenium和Chrome WebDriver来获取 【腾讯云 Cloud Studio 实战训练营】中的文章信息

使用腾讯云 Cloud studio 实现调度百度AI实现文字识别

【玩转Python系列【小白必看】Python多线程爬虫:下载表情包网站的图片

【玩转Python系列】【小白必看】使用Python爬取双色球历史数据并可视化分析

【玩转python系列】【小白必看】使用Python爬虫技术获取代理IP并保存到文件中

【小白必看】Python图片合成示例之使用PIL库实现多张图片按行列合成

【小白必看】Python爬虫实战之批量下载女神图片并保存到本地

【小白必看】Python词云生成器详细解析及代码实现

【小白必看】Python爬取NBA球员数据示例

【小白必看】使用Python爬取喜马拉雅音频并保存的示例代码

【小白必看】使用Python批量下载英雄联盟皮肤图片的技术实现

【小白必看】Python爬虫数据处理与可视化

【小白必看】轻松获取王者荣耀英雄皮肤图片的Python爬虫程序

【小白必看】利用Python生成个性化名单Word文档

【小白必看】Python爬虫实战:获取阴阳师网站图片并自动保存

小白必看系列之图书管理系统-登录和注册功能示例代码

小白实战100案例: 完整简单的双色球彩票中奖判断程序,适合小白入门

使用 geopandas 和 shapely(.shp) 进行地理空间数据处理和可视化

使用selenium爬取猫眼电影榜单数据

图像增强算法Retinex原理与实现详解

爬虫入门指南(8): 编写天气数据爬虫程序,实现可视化分析

爬虫入门指南(7):使用Selenium和BeautifulSoup爬取豆瓣电影Top250实例讲解【爬虫小白必看】

爬虫入门指南(6):反爬虫与高级技巧:IP代理、User-Agent伪装、Cookie绕过登录验证及验证码识别工具

爬虫入门指南(5): 分布式爬虫与并发控制 【提高爬取效率与请求合理性控制的实现方法】

爬虫入门指南(4): 使用Selenium和API爬取动态网页的最佳方法

爬虫入门指南(3):Python网络请求及常见反爬虫策略应对方法

爬虫入门指南(2):如何使用正则表达式进行数据提取和处理

爬虫入门指南(1):学习爬虫的基础知识和技巧

深度学习模型在图像识别中的应用:CIFAR-10数据集实践与准确率分析

Python面向对象编程基础知识和示例代码

MySQL 数据库操作指南:学习如何使用 Python 进行增删改查操作

Python文件操作指南:编码、读取、写入和异常处理

使用Python和Selenium自动化爬取 #【端午特别征文】 探索技术极致,未来因你出“粽” # 的投稿文章

Python多线程与多进程教程:全面解析、代码案例与优化技巧

Selenium自动化工具集 - 完整指南和使用教程

Python网络爬虫基础进阶到实战教程

Python入门教程:掌握for循环、while循环、字符串操作、文件读写与异常处理等基础知识

Pandas数据处理与分析教程:从基础到实战

Python 中常用的数据类型及相关操作详解

【2023年最新】提高分类模型指标的六大方案详解

Python编程入门基础及高级技能、Web开发、数据分析和机器学习与人工智能

用4种回归方法绘制预测结果图表:向量回归、随机森林回归、线性回归、K-最近邻回归

http://www.lryc.cn/news/137310.html

相关文章:

  • MongoDB【CRUD练习-条件查询-文档关系】
  • 使用M2Mqtt 接受以及发布MQTT消息
  • 【SA8295P 源码分析】33 - Android GVM USB 透传配置
  • 华为OD机试 - 过滤组合字符串 - 深度优先搜索dfs算法(Java 2023 B卷 100分)
  • 【Unity自制手册】游戏基础API大全
  • 【LVS】4、HAProxy搭建web集群
  • 【应用层】网络基础 -- HTTP协议
  • 【线性DP】模型总结(terse版)
  • conda 常用命令
  • 前端面试:【异步编程】Callback、Promise和Async/Await
  • 大数据(四):Pandas的基础应用详解
  • 计算机网络第3章(数据链路层)
  • stm32之4.时钟体系
  • RPC和HTTP协议
  • BUGFix:onnx -> TensorRT转换过程失败
  • FFMPEG小白常用命令行
  • 个性定制还是纯粹简约:探寻界面选择背后的心理宇宙
  • 【Java 高阶】一文精通 Spring MVC - 转发重定向(四)
  • 嵌入式Linux开发实操(十):ADC接口开发
  • 精进语言模型:探索LLM Training微调与奖励模型技术的新途径
  • 数据采集:selenium 提取 Cookie 自动登陆
  • [Go版]算法通关村第十三关黄金——数字数学问题之数论问题(最大公约数、素数、埃氏筛、丑数)
  • Qt双击某一文件通过自己实现的程序打开,并加载文件显示
  • 硬件产品的量产问题------硬件工程师在产线关注什么
  • Vulnhub系列靶机--- Hackadmeic.RTB1
  • redis高级----------主从复制
  • posgresql通过PL/pgSQL脚本统一修改某字段大小写
  • iPhone卫星通信SOS功能如何在灾难中拯救生命
  • NOIP真题答案 过河 数的划分
  • 图为科技-边缘计算在智慧医疗领域的作用