当前位置: 首页 > news >正文

Python 正则表达式 (?=...) 和 (?<=...) 符号

Python 正则表达式

  • 引言
  • 正文
    • 示例1
    • 示例2
    • 示例3
    • 示例4

引言

今天遇到了一个比较棘手的问题,于是终于打算要对正则表达式中的 (?=...)(?<=...) 符号动手了。

正文

(?=...) 表示当 匹配时,匹配成功,但不消耗字符串中的任何字符。这个叫做 前视断言 (lookahead assertion)。比如, Isaac (?=Asimov) 将会匹配 Isaac ,仅当其后紧跟 Asimov

在 Python 正则表达式 (…) 符号 一文中,我们说明了为什么要使用 () 符号以及 ... 符号的含义。事实上,上述的 (?=...)(?<=...) 中的 ... 符号可以被替换为任意的符号,这里为了方便说明问题,我们将 ... 符号替换为 \t 符号。

示例1

import restr1 = 'abc\tdefghi\txyz'
print(re.search('(?=\t)', str1))
"""
result:
<re.Match object; span=(3, 3), match=''>
"""

可以看到,它匹配到了索引值为 3\t 字符,但是由于它是前视断言,即向前搜索,而我们的匹配项中 (?=\t) 之前并没有任何字符,因此什么也没有匹配到。

示例2

我们对示例 1 中的匹配内容稍作更改。

import restr1 = 'abc\tdefghi\txyz'
print(re.search('abc(?=\t)', str1))
"""
result:
<re.Match object; span=(0, 3), match='abc'>
"""

此时可以看到,匹配到了字符串 abc

示例3

(?<=...) 表示如果 ... 的匹配内容出现在当前位置的左侧,则匹配。这叫做 肯定型后视断言 (positive lookbehind assertion)(?<=abc)def 将会在 abcdef 中找到一个匹配,因为后视会回退 3 个字符并检查内部表达式是否匹配。内部表达式(匹配的内容)必须是固定长度的,意思就是 abca|b 是允许的,但是 a*a{3,4} 不可以。注意,以肯定型后视断言开头的正则表达式,匹配项一般不会位于搜索字符串的开头。

上面的解释比较抽象,那么具体是什么意思呢?我们看一个例子。

import restr1 = 'abc\tdefghi\txyz'
print(re.search('(?<=\t)def', str1))
"""
result:
<re.Match object; span=(4, 7), match='def'>
"""

程序先找到 def 字符串,然后再回退一个字符查看 def 前面的字符是否是 \t 字符,如果是,那么就匹配 def 字符串。

示例4

如果我们想要匹配两个 \t 字符中间的部分怎么办呢?

import restr1 = 'abc\tdefghi\txyz'
print(re.search('\t(.*)\t', str1))
"""
result:
<re.Match object; span=(3, 11), match='\tdefghi\t'>
"""

可以看到,此时,结果中包含了两端的 \t 字符,但是我们不想要它包含 \t 字符。为了实现这一目标,我们可以采用刚才我们提到的后视和前视。

import restr1 = 'abc\tdefghi\txyz'
print(re.search('(?<=\t).*(?=\t)', str1))
"""
result:
<re.Match object; span=(4, 10), match='defghi'>
"""

可以看到我们匹配到了两个 \t 字符中间的字符串,但是上述写法并不严谨,为了严谨,我们可以使用:

import restr1 = 'abc\tdefghi\txyz'
print(re.search('(?<=\t)(.*)(?=\t)', str1))
"""
result:
<re.Match object; span=(4, 10), match='defghi'>
"""

如果大家觉得有用,就请点个赞吧~

http://www.lryc.cn/news/346217.html

相关文章:

  • Vue.js中使用JavaScript实现路由跳转详解
  • 社群裂变:从微光到星火的社群增长奥秘
  • Git命令Gitee注册idea操作git超详细
  • 出差行程到底怎么管?这个“高分指南”划重点来了!
  • js设计模式--发布订阅者模式
  • 【图论】图论基础
  • Konga域名配置多个路由
  • 15.计算机网络
  • 【大数据·hadoop】在hdfs上运行shell基本常用命令
  • TCP/IP 协议基础:构建互联网基石
  • Android OpenMAX(三)高通OMX组件实现基础
  • 【比邻智选】MF871U模组
  • Unity 单例模式
  • Oracle-一次TX行锁堵塞事件
  • Gtid方式搭建主从复制+MHA高可用集群
  • 基于matlab GUI的Alpha shapes边缘提取
  • [Android]常见的包管理方式
  • 每日10亿数据的日志分析系统OOM
  • 智能驱动,精准管理:打造高效干部管理系统
  • 轮式机器人简介
  • 已知哈夫曼节点个数,求哈夫曼字符编码数
  • Kubernetes Cluster IP,Node IP,Pod IP间通信原理解析
  • 随机链表的深拷贝
  • 328_C++_HTTP_HTTP协议传输data数据,为什么要进行base64编解码操作?
  • 【二叉树】Leetcode N 叉树的层序遍历
  • Spring AI
  • fiori SAP ui5 动态改变控件颜色
  • RabbitMQ php amqp
  • 对称二叉树
  • 浅浅总结SQL中的事务.