当前位置: 首页 > news >正文

使用Python批量将飞书文档转为MD

说明:飞书是在线文档平台,本文介绍如何使用Python程序批量将飞书文档转为MD文档,并下载到本地;

复制地址

首先,把文档的URL都复制下来,这个需要一个一个点,并复制拷贝,但却是工作量最大的一步;

在这里插入图片描述

如下:

在这里插入图片描述

转换

飞书转为Markdown,在GitHub上有一个工具,可以在线将飞书的文档转为Markdown,并生成一个压缩包(.zip)到本地。

在这里插入图片描述

该工具,提供了一个在线版;

在这里插入图片描述

把前面飞书中的文档地址拷贝到这里,点DOWNLOAD就可以了。

在这里插入图片描述

分析

我们可以通过Python程序,将需要转为MarkDown的飞书文档,使用Python程序循环去访问这个地址就好了。

首先,分析前面转换攻击,点击DOWNLOAD后发送的请求链接,如下:

在这里插入图片描述

通过分析,可知,地址的格式是这样的;

在这里插入图片描述

格式:

https://feishu2md.onrender.com/download?url=https%3A%2F%2Fqwek6s2dw90.feishu.cn%2Fwiki%2F + 文档地址码 + %3Fchunked%3Dfalse

编码

这就好办了,开始编码,如下:

import requests# 飞书中的文档地址码
doc_list = ["XXXXXXXXXXXXXXXXXXBn9b","XXXXXXXXXXXXXXXXXXTnBg","XXXXXXXXXXXXXXXXXX5nFL","XXXXXXXXXXXXXXXXXXxnUs","XXXXXXXXXXXXXXXXXXOnGf","XXXXXXXXXXXXXXXXXXVnxb","XXXXXXXXXXXXXXXXXXgnhc","XXXXXXXXXXXXXXXXXXVnwc","XXXXXXXXXXXXXXXXXXAnIg","XXXXXXXXXXXXXXXXXXbnis","XXXXXXXXXXXXXXXXXXnnDg","XXXXXXXXXXXXXXXXXXJnDf","XXXXXXXXXXXXXXXXXXmnSd","XXXXXXXXXXXXXXXXXXEnlh","XXXXXXXXXXXXXXXXXXEnJg","XXXXXXXXXXXXXXXXXXjnBg",
]# 遍历文档并转换
for index, value in enumerate(doc_list):# 拼接URLurl = ("https://feishu2md.onrender.com/download?url=https%3A%2F%2Fqwek6s2dw90.feishu.cn%2Fwiki%2F"+ value+ "%3Fchunked%3Dfalse")# 发送请求response = requests.get(url, stream=True)# 写入到本地if response.status_code == 200:with open(r'C:\Users\10765\Desktop\markdown'+ '\\' + str(index) + ".zip", "wb") as f:for chunk in response.iter_content(chunk_size=8192):f.write(chunk)print("文件下载完成!")else:print("文件下载失败,状态码:", response.status_code)

设置路径为桌面,文件名为索引,启动程序,测试,下载速度取决于飞鸽文档的大小,我这十几个文档,十分钟左右都下载完成了;

在这里插入图片描述

压缩包中包含文档和静态资源(图片);

在这里插入图片描述

这样,批量将飞书文档转为MD文档的步骤就完成了;

http://www.lryc.cn/news/139129.html

相关文章:

  • Nacos配置管理、Feign远程调用、Gateway服务网关
  • 解决Spring Boot前后端分离开发模式中的跨域问题
  • 常见前端面试之VUE面试题汇总五
  • 带着问题看SpringBoot
  • 【Go 基础篇】Go语言匿名函数详解:灵活的函数表达式与闭包
  • MobileNet、MobileNetV2和MobileNetV3创新点总结
  • 算法:数据转换处理2(云台显控)
  • 让大数据平台数据安全可见-行云管家
  • 微信小程序开发教学系列(3)- 页面设计与布局
  • 基于JSP+Servlet+mysql员工权限管理系统
  • Qt 自定义提示框 右下角冒泡
  • js、PHP连接外卖小票机打印机方案(调用佳博、芯烨等)
  • window定时备份MySQL数据库,默认备份7天,一小时备份一次
  • 正则中常见的流派及其特性
  • .net6.0引用的dll放置单独的文件夹
  • CMake:检测外部库---自定义find模块
  • vue直接使用高德api
  • Setting
  • 时序预测 | Matlab实现SO-CNN-BiGRU蛇群算法优化卷积双向门控循环单元时间序列预测
  • 论文浅尝 | KRACL-利用图上下文和对比学习的稀疏KG补全
  • 【C++】右值引用,移动语义,完美转发
  • 【AI】即使AI 时代,程序员也无需焦虑
  • Django实现DRF数据API接口格式封装
  • [Go版]算法通关村第十三关白银——数字数学问题之数组实现加法、幂运算
  • 【 OpenGauss源码学习 —— 列存储(Insert)】
  • Android 13.0 framework中实现默认长按电源键弹出关机对话框功能
  • 微信小程序,封装身高体重选择器组件
  • 深度学习调参技巧
  • 图论基础和表示(Java 实例代码)
  • 各种数据库查询报错问题