当前位置: 首页 > news >正文

pptx 文件版面分析-- python-pptx(python 文档解析提取)

安装

pip install python-pptx -i https://pypi.tuna.tsinghua.edu.cn/simple --ignore-installed

pptx 解析代码实现

from pptx import Presentation
file_name = "rag_pptx/test1.pptx"
# 打开.pptx文件
ppt = Presentation(file_name)
for slide in ppt.slides:#print(slide)for shape in slide.shapes:if shape.has_text_frame:text_frame = shape.text_frameprint(text_frame.text)

参考
【非一般程序员训练营 第二季 —— RAG 潘多拉宝盒 任务二 版面分析模块】
python-pptx库中文文档及使用样例
pypi/python-pptx/
英文文档
中文文档

http://www.lryc.cn/news/341874.html

相关文章:

  • http的basic 认证方式
  • 【信息系统项目管理师练习题】信息系统治理
  • RabbitMQ之顺序消费
  • 轻松上手的LangChain学习说明书
  • 【论文笔记】Training language models to follow instructions with human feedback A部分
  • 嵌入式交叉编译:x265
  • 一、Redis五种常用数据类型
  • C语言动态内存管理malloc、calloc、realloc、free函数、内存泄漏、动态内存开辟的位置等的介绍
  • 最近惊爆谷歌裁员
  • 音频可视化:原生音频API为前端带来的全新可能!
  • 【中等】保研/考研408机试-动态规划1(01背包、完全背包、多重背包)
  • [DEMO]给两个字符串取交集的词语
  • leetcode53-Maximum Subarray
  • Python 基于 OpenCV 视觉图像处理实战 之 OpenCV 简单人脸检测/识别实战案例 之七 简单进行人脸检测并添加面具特效实现
  • 【go项目01_学习记录06】
  • Vue中Element的下载
  • 机器人项目相关
  • Mac升级go版本某种错误情况处理
  • 美团KV存储squirrel和Celler学习
  • Python学习笔记------处理数据和生成折线图
  • 知识图谱与大语言模型的协同(RAG)——MindMap
  • 奶爸预备 |《P.E.T.父母效能训练:让亲子沟通如此高效而简单:21世纪版》 / 托马斯·戈登——读书笔记
  • 【WebGIS实例】(13)MapboxGL 加载地形高程数据
  • Node.js -- MongoDB
  • 语音识别--单声道转换与降采样
  • 基于springboot+vue+Mysql的点餐平台网站
  • 数据库优化
  • 专业渗透测试 Phpsploit-Framework(PSF)框架软件小白入门教程(一)
  • Web安全研究(七)
  • 矩池云jupyter运行opengait代码 未完成版