当前位置: 首页 > news >正文

python实现word转html

目录

使用mammoth库

使用spire.doc库


使用mammoth库

mammoth库支持将word转为HTML和markdown格式的文件。

import mammothdef word_html(word_file):html_save_name = fr'{word_file.split('.')[0]}.html'with open(word_file, 'rb') as f:data = mammoth.convert_to_html(f)with open(html_save_name, 'w') as f:f.write(data.value)

使用spire.doc库

强大的word文件处理库,不太好的就是商业库转换出的文件有水印。

from spire.doc import Document, FileFormatdef word_html(word_file):html_save_name = fr'{word_file.split('.')[0]}.html'doc = Document()doc.LoadFromFile(word_file)doc.SaveToFile(html_save_name, FileFormat.Html)doc.Close()with open(html_save_name, 'r', encoding='utf-8') as f:data = f.read().replace('Evaluation Warning: The document was created with Spire.Doc for Python.', '')  # 去掉商业库spire.doc生成的水印信息with open(html_save_name, 'w', encoding='utf-8') as f:f.write(data)
http://www.lryc.cn/news/506839.html

相关文章:

  • nginx模块ngx-fancyindex 隐藏标题中的 / 和遇到的坑
  • 第二十四天 循环神经网络(RNN)LSTM与GRU
  • RocketMQ如何保证消息顺序?
  • LabVIEW实现GSM/GPRS通信
  • 关于如何做技术文档
  • 基于多尺度动态卷积的图像分类
  • RK3576 介绍
  • 如何评估并持续优化AI呼出机器人的使用效果
  • Ubuntu上如何部署Nginx?
  • 制造业4.0:AI与机器人如何重塑生产线
  • ChatGPT与领域特定语言的集成
  • 【记录50】uniapp安装uview插件,样式引入失败分析及解决
  • 【WPF】把DockPanel的内容生成图像
  • 买卖股票的最佳时机 - 合集
  • lshw学习——简单介绍
  • 深入理解Kafka:核心设计与实践原理读书笔记
  • OnOn-WebSsh (昂~昂~轻量级WebSSH) 可实现 网页 中的 ssh 客户端操作,支持多用户多线程操作 ssh 持久化
  • LDP+LBP代码解析及应用场景分析
  • 51c视觉~合集33
  • element plus的table组件,点击table的数据是,会出现一个黑色边框
  • springmvc的拦截器,全局异常处理和文件上传
  • 【coredump】笔记
  • 【Linux】磁盘空间莫名消失,找不到具体原因的思路
  • 智能体实战(需求分析助手)一、需求概述及迭代规划
  • idea | maven项目标红解决方案 | 强制刷新所有依赖
  • *【每日一题 基础题】 [蓝桥杯 2023 省 B] 飞机降落
  • 在Windows本地用网页查看编辑服务器上的 jupyter notebook
  • OpenCV圆形标定板检测算法findGrid原理详解
  • 自动图像标注可体验
  • 武汉市电子信息与通信工程职称公示了