当前位置: 首页 > news >正文

第4.3节:awk正则表达式详解-特殊字符

1 第4.3节:正则表达式详解-特殊字符

  除了普通字符和转义字符外,正则表达式中还有类特殊字符,可以对正则表达式的行为进行修饰,下表是一些常用的正则表达式特殊字符及含义:

字符说明
^匹配输入字符串的开始位置。要匹配 “^” 字符本身,请使用 “\^”
$匹配输入字符串的结尾位置。要匹配 “$” 字符本身,请使用 “\$”
( )标记一个子表达式的开始和结束位置。要匹配小括号,请使用 “\(” 和 “\)”
[…]用来自定义能够匹配 ‘多种字符’ 的表达式,[]中的…表示用户自定义字符。要匹配中括号,请使用 “\[” 和 “\]”
[^…]这是一个否定逻辑,匹配任何字符但除了这里[]中定义的字符。
{ }修饰匹配次数的符号。要匹配大括号,请使用 “\{” 和 “\}”
.匹配除了换行符(\n)以外的任意一个字符。要匹配小数点本身,请使用 “\.”
?修饰匹配次数为 0 次或 1 次。要匹配 “?” 字符本身,请使用 “\?”
+修饰匹配次数为至少 1 次。要匹配 “+” 字符本身,请使用 “\+”
*修饰匹配次数为 0 次或任意次。要匹配 “*” 字符本身,请使用 “\*”
|左右两边表达式之间 “或” 关系。匹配 "
  • 示例1:使用“^”筛选行首是数字的文本

文本样例:

sample
123
456
789abc
012345678
end

awk代码及运行结果:

$ awk '/^[[:digit:]]+/' sample1.txt
123
456
789abc
012345678
  • 示例2:使用“$”筛选整行都是数字的文本
      上述文本样例中,有部分行是数字+字符的,如果想筛选出全部是 数字的行,该如何处理呢?此时可以使用“^”和“$”来联合约束文本内容:

awk代码及运行结果:

$ awk '/^[[:digit:]]+$/' sample1.txt
123
456
012345678
  • 示例3:利用分组把数字文本行前加上TEL:前缀
      使用正则表达式时,很我场景是查找出符合条件的文本,将其整理成新的格式,此时就使用到了分组。

awk代码及运行结果:

$ awk '/^[[:digit:]]+$/{print gensub(/(.*)/, "TEL: \\1", "g")}' sample1.txt
TEL: 123
TEL: 456
TEL: 012345678
  • 示例4:限定匹配次数,输出3个数字的文本行
$ awk '/^[[:digit:]]{3}$/' sample1.txt
123
456

注意:正则表达式中的{3}表示匹配3个数字,其实,{}次数限定中有两个参数:{最少次数, 最多次数},使用时有很多用法:

  • {指定次数}:严格指定前面的匹配多少次。
  • {最小次数,}:至少要匹配上最小次数,多则不限, 比如:[0-9]{3,}可以匹配123123412345
  • {,最大次数}:至多匹配不要超过最大次数,最少为0次,比如:[0-9]{,3}可以匹配112123,但不能匹配1234
  • {,}:匹配0到无数次,和+的效果相同。注:{}是错误用法。

作者声明:本文用于记录和分享作者的学习心得,可能有部分文字或示例来自AI平台,如:豆包、DeepSeek(硅基流动)(注册链接)等,由于本人水平有限,难免存在表达错误,欢迎留言交流和指教!
Copyright © 2022~2025 All rights reserved.

http://www.lryc.cn/news/625023.html

相关文章:

  • Pytest测试框架基础及进阶
  • 前端css学习笔记7:各种居中布局空白问题
  • Jenkins全链路教程——Jenkins调用Maven构建项目
  • IoT/透过oc_lwm2m和at源码,分析NB-IoT通信模组和主板MCU之间的通信过程
  • 【Jenkins】03 - 自动构建和docker构建
  • 【opencv-Python学习笔记(7):图像平滑处理】
  • 删除并获得点数
  • label studio标注时序数据
  • 力扣热题100------19.删除链表的倒数第N个结点
  • 深度学习篇---卷积
  • Linux unistd.h 包含功能
  • Spring 三级缓存:破解循环依赖的底层密码
  • 使用Idea安装JDK
  • [Code Analysis] docs | Web应用前端
  • 计算机视觉(9)-实践中遇到的问题(六路相机模型采集训练部署全流程)
  • OpenTelemetry、Jaeger 与 Zipkin:分布式链路追踪方案对比与实践
  • 大模型的底层运算线性代数
  • 关系型数据库与非关系型数据库
  • 母猪姿态转换行为识别:计算机视觉与行为识别模型调优指南
  • 我的 LeetCode 日记:Day 9 - 字符串终章与 KMP 算法
  • Baumer高防护相机如何通过YoloV8深度学习模型实现手势识别和指尖检测识别(C#代码UI界面版)
  • 第十六届蓝桥杯青少组C++省赛[2025.8.10]第二部分编程题(6、魔术扑克牌排列)
  • 算法题——字符串
  • RecSys:排序中的融分公式与视频播放建模
  • OVS:ovn为什么默认选择Geneve作为二层隧道网络协议?
  • 【EI会议征稿通知】第五届高性能计算、大数据与通信工程国际学术会议(ICHBC 2025)
  • 人工智能与生物科技的融合:重塑生命未来的无限可能​
  • android 实现表格效果
  • 力扣(LeetCode) ——100. 相同的树(C语言)
  • Rust 异步中的 Waker