当前位置: 首页 > news >正文

提取word文档里面的图片

  大家好,我是阿赵。
  阿赵我写博客的时候的习惯是,先用word文档写好,然后再把word文档里面的图片另存,最后再在博客里面复制正文和上传图片。
  而我写的文章一般配图都比较多,所以经常要做的一个功能就是另存图片。由于我没有买正版的Office工具,我用的是WPS工具来编辑word文档的。wps虽然是免费的,但它保存文档里面的所有图片是需要会员收费的,不然就只能一张一张图片手动保存。
  然而作为程序员,在觉得不该花钱的地方,我也是不会乱花的。我自己写了一个小程序,把文档里面的所有图片提取并保存,这里分享一下,这是一个用C#写的winform程序:
在这里插入图片描述

using Spire.Doc;
using Spire.Doc.Documents;
using Spire.Doc.Fields;
using System;
using System.Windows.Forms;
using Tools;namespace PickWordTexture
{public partial class Form1 : Form{public Form1(){InitializeComponent();}private string wordPath = "";private string savePath = "";private void ShowTips(string content){MessageBox.Show(content);}private bool ShowTipsSelect(string content){DialogResult result = MessageBox.Show(content, "提示", MessageBoxButtons.OKCancel);if(result == DialogResult.OK){return true;}else{return false;}}private void SetWordPath(string path){wordPath = path;string fullFileName = FilePathHelper.GetFileName(path);string fileName = FilePathHelper.RemoveExName(fullFileName);savePath = path.Replace(fullFileName,"")+fileName+"\\";UpdateView();}private void UpdateView(){wordPathTxt.Text = wordPath;savePathTxt.Text = savePath;}private void PickTextureFun(){if(string.IsNullOrEmpty(wordPath)||string.IsNullOrEmpty(savePath)){ShowTips("请先把需要提取的word文档拖动到窗口内");return;}if(FileManager.IsDirectoryExists(savePath)){if(ShowTipsSelect("保存的文件夹已经存在,将会覆盖,原有内容将会被删除,是否继续?")==true){FileManager.DelFolder(savePath);}else{return;}}Document document;string exName = FilePathHelper.GetExName(wordPath).ToLower();if(exName == "doc"){document = new Document(wordPath, FileFormat.Doc);}else{document = new Document(wordPath, FileFormat.Docx);}int count = 0;foreach(Section section in document.Sections){foreach(Paragraph paragraph in section.Paragraphs){foreach(DocumentObject docObject in paragraph.ChildObjects){if(docObject.DocumentObjectType == DocumentObjectType.Picture){DocPicture picture = docObject as DocPicture;string imgName = savePath + "Image_" + (count + 1) + ".png";FileManager.CheckFileSavePath(imgName);picture.Image.Save(imgName, System.Drawing.Imaging.ImageFormat.Png);count++;}}}}if(count == 0){ShowTips("文档里面没有图片");}else{ShowTips("提取到图片:" + count + "张");}}private void Form1_DragDrop(object sender, DragEventArgs e){string inputPath = ((Array)e.Data.GetData(DataFormats.FileDrop)).GetValue(0).ToString();string exName = FilePathHelper.GetExName(inputPath).ToLower();if(exName!="doc"&&exName!="docx"){ShowTips("只能拖动word文档(扩展名是doc或者docx)");}else{SetWordPath(inputPath);}}private void Form1_DragEnter(object sender, DragEventArgs e){if (e.Data.GetDataPresent(DataFormats.FileDrop)){e.Effect = DragDropEffects.Link;}else{e.Effect = DragDropEffects.None;}}private void pickTextureBtn_Click(object sender, EventArgs e){PickTextureFun();}}
}

  里面主要用到了Spire.Doc。然后还有一些我自己写的保存文件的工具类。这些工具类你们可以自己写IO方法替代一下,或者以后我再分享。
  把文档拖到工具上:
在这里插入图片描述

  工具会自动文档路径和保存路径
在这里插入图片描述

  点击提取所有图片,就提取完成了:
在这里插入图片描述

  在原来的文档旁边会新生成一个文件夹
在这里插入图片描述

  里面就是提取完的图片:
在这里插入图片描述

http://www.lryc.cn/news/332915.html

相关文章:

  • MybatisPlus总结
  • 使用 mitmproxy 抓包 grpc
  • 【解决Jetson Nano 内存不足问题】纯命令行将 Conda 环境迁移到 SD 卡
  • 【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(七)- 向量算术指令格式
  • 顺序表的应用
  • 2024-04-03-代码随想录算法训练营第一天[LeetCode704二分查找、LeetCode27移除元素]
  • [Go运行问题]/lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_xx‘ not found
  • matrix-breakout-2-morpheus 靶机渗透
  • 爬虫 新闻网站 以湖南法治报为例(含详细注释) V1.0
  • 物联网实战--入门篇之(十)安卓QT--后端开发
  • [Java]网络编程
  • 重读Java设计模式: 适配器模式解析
  • MySQL面试题系列-9
  • 书生·浦语训练营二期第二次笔记
  • python_3
  • 【Python】 使用Apache Tika和Python实现zip、csv、xls等多格式文件文本内容提取
  • C语言如何将多维数组名作为函数参数?
  • 2013年认证杯SPSSPRO杯数学建模C题(第二阶段)公路运输业对于国内生产总值的影响分析全过程文档及程序
  • 《LeetCode力扣练习》代码随想录——二叉树(合并二叉树---Java)
  • openstack云计算(二)——使用Packstack安装器安装一体化OpenStack云平台
  • Flutter Don‘t use ‘BuildContext‘s across async gaps.
  • 基于SSM+Jsp+Mysql的个性化影片推荐系统
  • 循环队列的实现及应用——桶排序bucket_sort、基数排序radix_sort
  • ubuntu16如何使用高版本cmake
  • 电商-广告投放效果分析(KMeans聚类、数据分析-pyhton数据分析
  • 练习 16 Web [极客大挑战 2019]LoveSQL
  • C++——栈和队列容器
  • Java集合(个人整理笔记)
  • Redis -- 缓存穿透问题解决思路
  • 数据挖掘中的PCA和KMeans:Airbnb房源案例研究