当前位置：首页 > news >正文

python全栈学习记录（十八）re、os和sys、subprocess

news 2025/7/4 22:14:26

re、os和sys、subprocess

文章目录

re、os和sys、subprocess
一、re
- 1.正则字符
- 2.正则表达式的使用
- 3.group的使用
- 4.贪婪匹配与惰性匹配
- 5.其他注意事项
二、os和sys
- 1.os
- 2.sys
三、subprocess
四、打印进度条

一、re

python中的re模块用来使用正则表达式，正则就是用一系列具有特殊含义的字符组成一套规则，该规则用来描述具有某一特征的字符串，正则就是用来去一个大的字符串中匹配出符合规则的子字符串。

1.正则字符

*表示字符出现0次及以上
+表示字符出现1次及以上
{2,5}表示字符出现2至5次
?表示字符出现0或1次
.表示任意字符
(a|b)表示a或b
(a&b)表示a与b
[a-z A-Z]表示所有英文字母
注意：[+ - * /]会报错，-在[]内表示取范围，如果想表示减号需要转义-
[^0-9] 表示取数字以外的字符，^在[]内表示取反
\d表示数字 \D表示非数字
\w表示字母、数字、下划线 \W表示非字母、数字、下划线
\s表示空白字符(换号、空格、制表符等) \S表示非空白字符
\d表示边界( ab ,左右侧的空格就是边界)
^表示字符首行 $表示字符末尾

2.正则表达式的使用

re.findall(正则字符，字符串，flag)会匹配字符串中所有的满足要求内容，并返回列表
常见的flag设置有三种，re.I表示不区分大小写；re.M表示多行匹配，^和$可以匹配多行的首尾;re.DOTALL表示.可以匹配到换行。

import re
#匹配以139开头的手机号码
res=re.findall('139.{8}','13914011111 13812311111 13915111111')
print(res)
<<<['13914011111', '13915111111']

re.search(正则字符，字符串，flag)会以match对象的形式返回一个匹配值(match对象中包含了值和索引)

import re
#匹配以139开头的手机号码
res=re.search('139.{8}','13914011111 13812311111 13915111111')
print(res)
<re.Match object; span=(0, 11), match='13914011111'>
#可以通过group函数取出match对象内的值,span函数取出其索引
print(res.group())
print(res.span())
<<<13914011111
<<<(0,11)

re.split(正则字符，字符串，flag)表示按正则规则拆分字符串，返回拆分后的列表

import re
res=re.split('\W+','adc ?ews12  wdssa+_ssa')
print(res)
<<<['adc', 'ews12', 'wdssa', '_ssa']

re.sub(正则字符，替换字符串/函数地址，字符串，flag)表示按正则匹配规则替换字符串中的字符

import re
#把以139开头的电话换为138开头
res=re.sub('139.{8}',lambda x:f'138{x.group()[3:]}','13914011111 13812311111 13915111111')
print(res)
<<<13814011111 13812311111 13815111111

re.finditer(正则字符，字符串，flag)表示返回匹配值match对象的的迭代器

import re
#匹配以139开头的手机号码
res=re.finditer('139.{8}','13914011111 13812311111 13915111111')
print(res.__next__())
print(res.__next__())
<<<<re.Match object; span=(0, 11), match='13914011111'>
<<<<re.Match object; span=(24, 35), match='13915111111'>

re.compile(正则字符)表示将正则表达式传给变量

import re
a=re.compile('[a-z]+')
print(a.findall('adsds1223fd?.dsas23'))
<<<['adsds', 'fd', 'dsas']

3.group的使用

在正则表达式中group表示分组，group需要与match对象一起使用，()括起来的正则字符表示分为一组，可以通过group函数查看组内的字符

import re
res=re.search('(139)-(.{8})','139-14011111')
#查看第一组的字符
print(res.group(1))
#查看第二组的字符
print(res.group(2))
#查看匹配的字符
print(res.group())
#查看所有组的字符
print(res.groups())<<<139
<<<14011111
<<<139-14011111
<<<('139', '14011111')

4.贪婪匹配与惰性匹配

贪婪匹配表示尽可能匹配多的内容(默认)，惰性匹配表示尽可能匹配少的内容

import re
res=re.findall('.+','1234567')
print(res)
<<<['1234567']#切换惰性匹配时，需要在匹配式最后加上?
res=re.findall('.+?','1234567')
print(res)
<<<['1', '2', '3', '4', '5', '6', '7']

5.其他注意事项

在非返回match对象的一些函数中()表示只输出括号中匹配的内容(匹配边界)，若一组正则字符中出现多个()会将一次匹配到的内容放入一个元组中

import re
res=re.findall('12(34)','1234')
print(res)
<<<['34']import re
res=re.findall('12(3)(4)','1234')
print(res)
<<<[('3', '4')]

当正则字符中出现小括号时，默认会被当做匹配边界，如果你想让其保持小括号的意思时，需要在(后加?:

import re
res=re.findall('123(4|5)','1234 1235')
print(res)
<<<['4', '5']import re
res=re.findall('123(?:4|5)','1234 1235')
print(res)
<<<['1234', '1235']

在正则字符传入python解释器的过程中会经历两次转义过程，第一次是作为python字符串的转义，第二次是作为正则字符的转义，例如‘12\b’python会把字符转义为’12\x08’(\x08表示退格)传给正则模块，然后正则模块匹配’12\x08’。
现在我想让正则表达式成功匹配到‘\c(1)'这个字符串，可以如何写正则字符呢？

import re
a=‘\c(1)'
#给字符串前面加r以后python就不会对字符串进行转义
#方式一
res=re.findall(r'\\c\(1\)',a)
print(res)
<<<['\\c(1)']#输出时windows会将\c转义为\\c
#解释：python将'\\c\(1\)'传给正则模块，正则模块把\\c、\(和\)转义为\c、(和)#方式二
res=re.findall(r'\\\c\\(1\\)',a)
print(res)
<<<['\\c(1)']
#解释：python将\\转义为\以后把'\\c\(1\)'传给正则模块，正则模块把\\c、\(和\)转义为\c、(和)

注意点：正则表达式中匹配 \需要在表达式中写\ \

二、os和sys

1.os

在这里插入图片描述

os.getpid()表示获取pid号
os.getppid()表示获取父进程pid号

2.sys

sys.argv()返回列表，列表里是用户在终端传入的参数(例如用户在终端运行python 输入 python3 a.py 123 456，123和456两个参数会被传入argv)
sys.setrecursionlimit(n)表示设置最大递归深度为n
sys.path表示导入模块的路径

三、subprocess

subprocess模块可以使用python控制终端窗口

import subprocess
#tasklist为windows的终端命令，表示产看进程信息
#stdout和stderr表示终端返回的正确信息和错误信息
#subprocess.PIPE表示管道，正确信息和错误信息会通过管道传给subprocess模块
#运行subprocess.Popen会产生一个子进程，而res.stdout.read()会等待子进程运行结束并返回终端正常执行命令以后的结果
res=subprocess.Popen('tasklist',shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
b=res.stdout.read()
print(b.decode('gbk'))

四、打印进度条

import timedef make_progress(percent,width=50):if percent > 1:percent=1#在%的格式化字符中表示%需写为%%，show_str=('[%%-%ds]' % width) % (int(percent * width) * '#')print('\r%s %s%%' %(show_str,int(percent * 100)),end='')total_size=10240
recv_size=0
while recv_size < total_size:time.sleep(0.5) # 模拟经过了0.5的网络延迟下载了1024个字节recv_size+=1024# 调用打印进度条的功能去打印进度条percent=recv_size / total_sizemake_progress(percent)