当前位置: 首页 > news >正文

爬虫-正则使用

1.模块选择

用re模块导入,,最前面加个r,就不用怕转义了

2.模块使用

 re.findall

使用

结果是数组方式呈现

re.finditer

把结果变成迭代器,从迭代器类中间取数

re.search

re.search 只能匹配到第一个识别到的内容

re.match

3.推荐写法

先预加载完,就不用每次加载了,节省内存,用obj.引用

分组命名找数据,将id分为一类   ?P<xxxx>

http://www.lryc.cn/news/584337.html

相关文章:

  • 8.2.3希尔排序
  • 【Bluedroid】蓝牙协议栈控制器能力解析与核心功能配置机制(decode_controller_support)
  • 【Nginx】Nginx 安装与 Sticky 模块配置
  • Android 13----在framworks层映射一个物理按键
  • FlashAttention 快速安装指南(避免长时间编译)
  • GoView 低代码数据可视化
  • JAVA JVM对象的实现
  • 机器学习与光子学的融合正重塑光学器件设计范式
  • 统计文件内容:统计一个文本文件中字符、单词、行数。
  • C#中异步任务取消:CancellationToken
  • HOOK专题
  • Linux流量分析:tcpdump wireshark
  • EchoSight-Pro发布说明
  • 【网络】Linux 内核优化实战 - net.ipv4.tcp_fin_timeout
  • Android Coil 3 data加载图的Bitmap或ByteArray数据类型,Kotlin
  • 设计总监年中复盘:用Adobe XD内容识别布局,告别“手动调距”
  • 大模型在膀胱癌诊疗全流程预测及应用研究报告
  • HarmonyOS AI辅助编程工具(CodeGenie)UI生成
  • RabbitMQ 高级特性之消息分发
  • web 系统对接飞书三方登录完整步骤实战使用示例
  • 网络安全(初级)(1)
  • AI+低代码双引擎驱动:重构智能业务系统的产品逻辑
  • Fiddler中文版全面评测:功能亮点、使用场景与中文网资源整合指南
  • 深入理解机器学习
  • CPU调度调度算法
  • 链表算法之【合并两个有序链表】
  • Web后端开发工程师AI协作指南
  • 【java面试day4】redis缓存-数据持久化
  • AI赋能生活:深度解析与技术洞察
  • 【论文阅读】Decoupled Knowledge Distillation