当前位置: 首页 > news >正文

python全栈学习记录(十八)re、os和sys、subprocess

re、os和sys、subprocess

文章目录

  • re、os和sys、subprocess
  • 一、re
    • 1.正则字符
    • 2.正则表达式的使用
    • 3.group的使用
    • 4.贪婪匹配与惰性匹配
    • 5.其他注意事项
  • 二、os和sys
    • 1.os
    • 2.sys
  • 三、subprocess
  • 四、打印进度条

一、re

python中的re模块用来使用正则表达式,正则就是用一系列具有特殊含义的字符组成一套规则,该规则用来描述具有某一特征的字符串,正则就是用来去一个大的字符串中匹配出符合规则的子字符串。

1.正则字符

*表示字符出现0次及以上
+表示字符出现1次及以上
{2,5}表示字符出现2至5次
?表示字符出现0或1次
.表示任意字符
(a|b)表示a或b
(a&b)表示a与b
[a-z A-Z]表示所有英文字母
注意:[+ - * /]会报错,-在[]内表示取范围,如果想表示减号需要转义-
[^0-9] 表示取数字以外的字符,^在[]内表示取反
\d表示数字 \D表示非数字
\w表示字母、数字、下划线 \W表示非字母、数字、下划线
\s表示空白字符(换号、空格、制表符等) \S表示非空白字符
\d表示边界( ab ,左右侧的空格就是边界)
^表示字符首行 $表示字符末尾

2.正则表达式的使用

re.findall(正则字符,字符串,flag)会匹配字符串中所有的满足要求内容,并返回列表
常见的flag设置有三种,re.I表示不区分大小写;re.M表示多行匹配,^和$可以匹配多行的首尾;re.DOTALL表示.可以匹配到换行。

import re
#匹配以139开头的手机号码
res=re.findall('139.{8}','13914011111 13812311111 13915111111')
print(res)
<<<['13914011111', '13915111111']

re.search(正则字符,字符串,flag)会以match对象的形式返回一个匹配值(match对象中包含了值和索引)

import re
#匹配以139开头的手机号码
res=re.search('139.{8}','13914011111 13812311111 13915111111')
print(res)
<re.Match object; span=(0, 11), match='13914011111'>
#可以通过group函数取出match对象内的值,span函数取出其索引
print(res.group())
print(res.span())
<<<13914011111
<<<(0,11)

re.split(正则字符,字符串,flag)表示按正则规则拆分字符串,返回拆分后的列表

import re
res=re.split('\W+','adc ?ews12  wdssa+_ssa')
print(res)
<<<['adc', 'ews12', 'wdssa', '_ssa']

re.sub(正则字符,替换字符串/函数地址,字符串,flag)表示按正则匹配规则替换字符串中的字符

import re
#把以139开头的电话换为138开头
res=re.sub('139.{8}',lambda x:f'138{x.group()[3:]}','13914011111 13812311111 13915111111')
print(res)
<<<13814011111 13812311111 13815111111

re.finditer(正则字符,字符串,flag)表示返回匹配值match对象的的迭代器

import re
#匹配以139开头的手机号码
res=re.finditer('139.{8}','13914011111 13812311111 13915111111')
print(res.__next__())
print(res.__next__())
<<<<re.Match object; span=(0, 11), match='13914011111'>
<<<<re.Match object; span=(24, 35), match='13915111111'>

re.compile(正则字符)表示将正则表达式传给变量

import re
a=re.compile('[a-z]+')
print(a.findall('adsds1223fd?.dsas23'))
<<<['adsds', 'fd', 'dsas']

3.group的使用

在正则表达式中group表示分组,group需要与match对象一起使用,()括起来的正则字符表示分为一组,可以通过group函数查看组内的字符

import re
res=re.search('(139)-(.{8})','139-14011111')
#查看第一组的字符
print(res.group(1))
#查看第二组的字符
print(res.group(2))
#查看匹配的字符
print(res.group())
#查看所有组的字符
print(res.groups())<<<139
<<<14011111
<<<139-14011111
<<<('139', '14011111')

4.贪婪匹配与惰性匹配

贪婪匹配表示尽可能匹配多的内容(默认),惰性匹配表示尽可能匹配少的内容

import re
res=re.findall('.+','1234567')
print(res)
<<<['1234567']#切换惰性匹配时,需要在匹配式最后加上?
res=re.findall('.+?','1234567')
print(res)
<<<['1', '2', '3', '4', '5', '6', '7']

5.其他注意事项

在非返回match对象的一些函数中()表示只输出括号中匹配的内容(匹配边界),若一组正则字符中出现多个()会将一次匹配到的内容放入一个元组中

import re
res=re.findall('12(34)','1234')
print(res)
<<<['34']import re
res=re.findall('12(3)(4)','1234')
print(res)
<<<[('3', '4')]

当正则字符中出现小括号时,默认会被当做匹配边界,如果你想让其保持小括号的意思时,需要在(后加?:

import re
res=re.findall('123(4|5)','1234 1235')
print(res)
<<<['4', '5']import re
res=re.findall('123(?:4|5)','1234 1235')
print(res)
<<<['1234', '1235']

在正则字符传入python解释器的过程中会经历两次转义过程,第一次是作为python字符串的转义,第二次是作为正则字符的转义,例如‘12\b’python会把字符转义为’12\x08’(\x08表示退格)传给正则模块,然后正则模块匹配’12\x08’。
现在我想让正则表达式成功匹配到‘\c(1)'这个字符串,可以如何写正则字符呢?

import re
a=‘\c(1)'
#给字符串前面加r以后python就不会对字符串进行转义
#方式一
res=re.findall(r'\\c\(1\)',a)
print(res)
<<<['\\c(1)']#输出时windows会将\c转义为\\c
#解释:python将'\\c\(1\)'传给正则模块,正则模块把\\c、\(和\)转义为\c、(和)#方式二
res=re.findall(r'\\\c\\(1\\)',a)
print(res)
<<<['\\c(1)']
#解释:python将\\转义为\以后把'\\c\(1\)'传给正则模块,正则模块把\\c、\(和\)转义为\c、(和)

注意点:正则表达式中匹配 \需要在表达式中写\ \

二、os和sys

1.os

在这里插入图片描述
在这里插入图片描述
os.getpid()表示获取pid号
os.getppid()表示获取父进程pid号

2.sys

sys.argv()返回列表,列表里是用户在终端传入的参数(例如用户在终端运行python 输入 python3 a.py 123 456,123和456两个参数会被传入argv)
sys.setrecursionlimit(n)表示设置最大递归深度为n
sys.path表示导入模块的路径

三、subprocess

subprocess模块可以使用python控制终端窗口

import subprocess
#tasklist为windows的终端命令,表示产看进程信息
#stdout和stderr表示终端返回的正确信息和错误信息
#subprocess.PIPE表示管道,正确信息和错误信息会通过管道传给subprocess模块
#运行subprocess.Popen会产生一个子进程,而res.stdout.read()会等待子进程运行结束并返回终端正常执行命令以后的结果
res=subprocess.Popen('tasklist',shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
b=res.stdout.read()
print(b.decode('gbk'))

四、打印进度条

import timedef make_progress(percent,width=50):if percent > 1:percent=1#在%的格式化字符中表示%需写为%%,show_str=('[%%-%ds]' % width) % (int(percent * width) * '#')print('\r%s %s%%' %(show_str,int(percent * 100)),end='')total_size=10240
recv_size=0
while recv_size < total_size:time.sleep(0.5) # 模拟经过了0.5的网络延迟下载了1024个字节recv_size+=1024# 调用打印进度条的功能去打印进度条percent=recv_size / total_sizemake_progress(percent)
http://www.lryc.cn/news/446680.html

相关文章:

  • GO Fsnotify学习与使用
  • 除了递归算法,要如何优化实现文件搜索功能
  • 【AI算法岗面试八股面经【超全整理】——NLP】
  • Unity 设计模式 之 创建型模式 -【单例模式】【原型模式】 【建造者模式】
  • CSS中的字体样式、文本样式、列表样式以及背景和渐变
  • 教你如何在Java中操作Redis
  • nsight-system教程
  • 进程的那些事--进程控制
  • FortiOS SSL VPN 用户访问权限配置
  • C++_vector类
  • Spring Boot入门到精通:网上购物商城系统
  • 在Vue.js中,你可以使用Element UI的el-input组件结合计算属性来实现模糊查询
  • delphi制作漂亮的农历窗体(IntraWeb+Layui的完美结合)
  • 发票OFD格式转换成PDF
  • 高通AI应用程序开发3:网络模型(一)
  • 03. 前端面试题之ts : typescript 的数据类型有哪些?
  • PyCharm和VS Code 安装通义灵码,可本地安装包安装,解决插件安装不上问题
  • 机器人速度雅可比矩阵求解(2自由度平面关节机器人)
  • 【AI大模型-文心-思维树解读-开篇】
  • 2、electron vue3 怎么创建子窗口,并给子窗口路由传参
  • 8.pod数据持久化
  • C语言 | Leetcode C语言题解之第436题寻找右区间
  • SpringBoot3中ymal配置文件(持续更新)
  • Linux 基础IO 2
  • 图像预处理 图像去噪之常见的去噪方法
  • 代码随想录Day53|102.沉没孤岛 、103.水流问题 、104.建造最大岛屿
  • 19c-pfile
  • 智能软件开启精准品牌控价
  • OpenCV特征检测(8)检测图像中圆形的函数HoughCircles()的使用
  • spark 大表与大表join时的Shuffle机制和过程