当前位置: 首页 > news >正文

正则表达式及文本三剑客grep sed awk

目录

正则表达式

1.元字符

2.表示次数

3.位置锚定

4.分组或其他

grep

sed

语法:

常用选项

脚本格式

例:

查找11点56到12点10的日志

修改文件,找到文件并给其后缀加上er

提取IP地址 

提取版本号 

 提取文件权限

awk

工作原理:

格式:


正则表达式

1.元字符

.                     //匹配任意单个字符,可以是个汉字
[yang]                //匹配范围内的任意单个字符
[^y]                  //匹配处理指定范围外的任意单个字符
[:alnum:]             //字母和数字
[:alpha:]             //代表任何英文大小写字符
[:lower:]             //小写字母
[:upper:]             //大写字母
[:blank:]             //空白字符
[:space:]             //包括空格、制表符
[:cntrl:]             //不可打印的控制字符

2.表示次数

*              //匹配前面的字符任意次包括0次
.*             //任意长度的任意字符,不包括0次
\{n\}          //匹配前面的字符n次
\{m,n\}        //匹配前面的字符至少m次,至多n次
\{,n\}         //匹配前面的字符至多n次
\{n,\}         //匹配前面的字符至少n次

3.位置锚定

^                  //行首锚定, 用于模式的最左侧
$                  //行尾锚定,用于模式的最右侧
^PATTERN$          //用于模式匹配整行
^$                 //空行
\< 或 \b           //词首锚定,用于单词模式的左侧
\> 或 \b           //词尾锚定,用于单词模式的右侧
\<PATTERN\>        //匹配整个单词

4.分组或其他

grep

grep
-color=auto        //对匹配到的文本着色显示
-m                 //匹配#次后停止
-v                 //显示不被pattern匹配到的行,即取反
-i                 //忽略字符大小写
-n                 //显示匹配的行号
-c                 //统计匹配的行数
-o                 //仅显示匹配到的字符串
-q                 //静默模式,不输出任何信息
-A # after         //后#行
-B # before        //前#行
-C # context       //前后各#行
-e                 //实现多个选项间的逻辑or关系
-w                 //匹配整个单词
-E                 //使用ERE,相当于egrep
-F                 //不支持正则表达式,相当于fgrep
-f                 //file 根据模式文件,处理两个文件相同内容 把第一个文件作为匹配条件
-r                 //递归目录,但不处理软链接
-R                 //递归目录,但处理软链接

sed

语法:

sed [选项] '脚本语法' [标准输入]

常用选项

-n        //关闭自动打印
-e        //多点编辑
-f        //从指定文件中读取编辑脚本
-r        //使用扩展正则表达式
-i.bak    //备份文件并原处编辑

脚本格式

p          //打印当前模式空间内容
Ip         //忽略大小写输出
d          //删除模式空间匹配的行
a          //在指定行后面追加文本
i          //在行前插入文本
c          //替换行为单行或多行文本

例:

sed -i.bak       //实际修改之前先备份一个带后缀的同名文件

查找11点56到12点10的日志

sed -n '/2023:11:56/,/2023:12:10/p' /var/log/messages

修改文件,找到文件并给其后缀加上er

提取IP地址 

ifconfig ens33|sed -nr '2s/.*inet (.*)  netmask.*/\1/p'

提取版本号 

cat text|sed -nr 's/.*-(.*).jar/\1/p'

 提取文件权限

stat text|sed -nr '4s#.*([0-9]{4}).*#\1#p'

awk

工作原理:

awk 比较倾向于将一行分成多个“字段”然后再进行处理,且默认情况下字段的分隔符为空格或 tab 键。awk 执行结果可以通过 print 的功能将字段数据打印显示。

格式:

awk 选项 模式 处理动作-F(大写)                    //指定分隔符-v                           //自定义变量-f                           //脚本
//处理动作
print:打印
printf:打印
//awk内置变量
NF:当前处理的行的字段个数
NR:当前处理的行的行号(序数)
$0:当前处理的行的整行内容
$n:当前处理行的第n个字段(第n列)

http://www.lryc.cn/news/252070.html

相关文章:

  • python爬虫之创建属于自己的ip代理池
  • 又添三位“信伙伴”,亚信安慧AntDB数据库与南京一鸣、广东鸿数、北京数见完成兼容互认
  • Linux --- 进程控制
  • SVG-椭圆弧-参数转换-计算公式-标准解读
  • 利用 LD_PRELOAD劫持动态链接库,绕过 disable_function
  • 网件R8500 trojan
  • 实现校园网开机自启动部署
  • pycharm 创建vue并实现简易路由功能
  • 2023年关于爬取Bilibili(B站)视频的一些最新资源和案例
  • HyperBDR云容灾v4.10.1发布,划重点:支持UCloud云平台自动化容灾+新增可灵活定义的备份策略
  • 第四十一篇,一次matlab与spdlog的合作
  • 【苍穹外卖】——第一天
  • 解决SecureFX的中文乱码问题
  • 【字符串匹配】【KMP算法】Leetcode 28 找出字符串中第一个匹配项的下标☆
  • 《洛谷深入浅出进阶篇》模意义下的乘法逆元+洛谷P3811
  • clickhouse -- clickhouse解析复杂JSON数组
  • 算法leetcode|91. 解码方法(rust重拳出击)
  • zabbix配置snmp trap--使用snmptrapd和Bash接收器(缺zabbix_trap_handler.sh文中自取)--图文教程
  • vue: 线上项目element-ui的icon偶尔乱码问题
  • fpga rom 初始化文件的一些心得
  • 从零构建属于自己的GPT系列3:模型训练2(训练函数解读、模型训练函数解读、代码逐行解读)
  • Python词频统计(数据整理)
  • 基本面选股的方法
  • 应用密码学期末复习(3)
  • PAD平板签约投屏-高端活动的选择
  • 分布式架构demo
  • TA-Lib学习研究笔记(二)——Overlap Studies上
  • 牛客java基础考点1 标识符和变量
  • Qt将打印信息输出到文件
  • 【risc-v】易灵思efinix FPGA sapphire_soc IP配置参数分享