当前位置: 首页 > news >正文

用python实现提取word中的所有图片

你可以使用python-docx库来处理word文件,然后遍历文件中的所有形状,找到图片。

首先,你需要安装python-docx库。在命令行中输入以下命令进行安装:

 

复制代码

pip install python-docx

然后,你可以使用以下代码提取word文件中的所有图片:

 

python复制代码

from docx import Document
from docx.shared import Inches
def extract_images(filename):
# 加载word文件
doc = Document(filename)
# 存储图片路径的列表
image_paths = []
# 遍历文件中的所有形状
for shape in doc.shapes:
# 如果形状是图片,则添加到列表中
if shape.has_image:
image_paths.append(shape.image.filename)
return image_paths

这个函数会返回一个列表,其中包含word文件中所有图片的路径。

请注意,这个函数只能提取word文件中嵌入的图片,无法提取链接的图片。如果你需要提取链接的图片,你可能需要使用更复杂的工具或库,如python-docx的高级版python-docx-image-to-data。

http://www.lryc.cn/news/275823.html

相关文章:

  • CoTracker 环境配置与ORB 特征点提取结合实现视频特征点追踪
  • 10000000000 大瓜背后的真相(附 PDD 算法真题)
  • python爬虫,简单的requests的get请求,百度搜索实例
  • UNION 和 UNION ALL
  • NPS 内网穿透安装
  • 【C++学习笔记】C++多值返回写法
  • 读取带有梯度的张量的具体的值
  • 【分布式微服务专题】SpringSecurity快速入门
  • EasyRecovery2024永久免费版电脑数据恢复软件
  • iphone 苹果 IOS 越狱详细图文保姆级教程非常简单
  • 华为HarmonyOS 创建第一个鸿蒙应用 运行Hello World
  • [C#]Onnxruntime部署Chinese CLIP实现以文搜图以文找图功能
  • openssl ans1定义的实体
  • 【Linux Shell】4. 数组
  • 蓝牙运动耳机哪款好用?运动用什么耳机比较好?2024运动耳机推荐
  • XD6500S一款串口SiP模块 射频LoRa芯片 内置sx1262
  • 【华为OD机试真题2023CD卷 JAVAJS】测试用例执行计划
  • 猫长期吃猫粮好吗?主食冻干猫粮那种好吃又健康
  • 计算机毕业设计-----ssm停车位租赁系统
  • Git保姆级安装教程
  • 听GPT 讲Rust源代码--compiler(34)
  • 视频融合云平台/智慧监控平台EassyCVR告警警告出错是什么原因?该如何解决?
  • Gin 路由注册与请求参数获取
  • Linux第11步_解决“挂载后的U盘出现中文乱码”
  • 【第一节】安装java jdk 21
  • vue3+echart绘制中国地图并根据后端返回的坐标实现涟漪动画效果
  • HCIA-Datacom题库(自己整理分类的)_09_Telent协议【13道题】
  • Git专栏篇
  • Java-字符串-String类
  • ubuntu安装docker指定版本