当前位置: 首页 > news >正文

python—如何提取word中指定内容

        假设有一个Word,该Word中存在 “联系人” 关键字,如何将该Word中的联系人所对应的内容提取出来呢?  该Word内容如下所示:       

      
        要在给定的Word文档中提取出与"联系人"关键字对应的内容,可以使用Python的python-docx库。以下是一个示例:

import docx# 加载Word文档
doc = docx.Document('your_document.docx')# 存储提取的内容
contacts = []# 遍历文档中的段落并提取联系人关键字对应的内容
for paragraph in doc.paragraphs:if '联系人' in paragraph.text:# 获取关键字后面的内容contact = paragraph.text.split('联系人', 1)[1]contacts.append(contact.strip())# 显示提取的内容
for contact in contacts:print(contact)

        在上面的代码中,将'your_document.docx'替换为你要读取的Word文档的文件名或路径。

        运行代码后,将会显示与"联系人"关键字对应的内容。请注意,在提取"联系人"关键字的内容时,假设该关键字后面的内容是需要提取的信息。如果情况不符合,可能需要根据具体的Word文档结构和需求进行调整。

        确保已经安装了python-docx库。如果尚未安装,可以使用以下命令进行安装:

pip install python-docx
        通过以上步骤,你就可以在Python中成功提取Word文档中与"联系人"关键字对应的内容了。

运行上述代码得到运行结果为:

联系人:张三
联系人:李四
联系人:王五

 若想同时获取联系人及对应的电话,则在遍历部分代码中添加 '电话' 关键字即可,如下所示:

# 遍历文档中的段落并提取指定内容
for paragraph in doc.paragraphs:if '联系人' in paragraph.text:target_content.append(paragraph.text)elif '电话' in paragraph.text:target_content.append(paragraph.text)

添加之后程序运行结果: 

联系人:张三
电话:153***55899
联系人:李四
电话:139***08783
联系人:王五
电话:139***52328

http://www.lryc.cn/news/185500.html

相关文章:

  • 分享几个通用个人简历模板|行业通用
  • 如何正确操作封箱机
  • mysql面试题7:MySQL事务原理是什么?MySQL事务的隔离级别有哪些?
  • vue 项目打包性能分析插件 webpack-bundle-analyzer
  • C++ day2
  • 【Kafka专题】Kafka集群架构设计原理详解
  • Docker 镜像的缓存特性
  • Javascript 笔记:object
  • 【vue3】可编辑el-table
  • 一个开源的安卓相机:OpenCamera
  • 分类预测 | MATLAB实现POA-CNN鹈鹕算法优化卷积神经网络多特征分类预测
  • 学习网络编程No.7【应用层之序列化和反序列化】
  • 小谈设计模式(10)—原型模式
  • 用《斗破苍穹》的视角打开C#3 标签与反射(人物创建与斗技使用)
  • c语言进阶部分详解(详细解析字符串常用函数,并进行模拟实现(下))
  • 一文看懂光模块的工作原理
  • 基于SpringBoot的桂林旅游景点导游平台
  • 【小程序 - 加强】自定义组件、使用npm包、全局数据共享、分包_05
  • Vue.js3学习篇--Vue模板应用
  • 【软考】5.2 传输介质/通信方式/IP地址/子网划分
  • 软件测试银行项目网上支付接口调用测试实例
  • w806 adc 中断扫描通道采集
  • 使用CSS的Positions布局打造响应式网页
  • 模型训练环境相关(CUDA、PyTorch)
  • 链动2+1模式:社交电商行业的新型商业模式与营销手段
  • 竞赛选题 深度学习 opencv python 实现中国交通标志识别
  • LuatOS-SOC接口文档(air780E)-- fskv - kv数据库,掉电不丢数据
  • 一篇文章教你Pytest快速入门和基础讲解,一定要看!
  • SpringBoot项目:Cannot find declaration to go to
  • 【高并发】多线程和高并发提纲