当前位置: 首页 > news >正文

typora删除多余图片

import os
import re
import shutil
from bs4 import BeautifulSoupimport warningswarnings.filterwarnings('ignore')
# 定义正则表达式用于匹配.md文件中的图片引用语句
pattern = re.compile(r'!\[.*]\((.*)\)')# 获取所有.md文件中的图片引用路径
references = set()
md_filepath = input("请输入 Markdown 文件所在目录的路径 : ")
# md_filepath = r'{}'.format(md_filepath)for file in os.listdir(md_filepath):if file.endswith('.md'):  # 扫描该路径下的所有.md文件,并查找其中的图片with open(os.path.join(md_filepath, file), 'r', encoding='utf-8') as f:text = f.read()references.update(pattern.findall(text))soup = BeautifulSoup(text, 'html.parser')for img in soup.find_all('img'):src = img.get('src')if src:references.add(os.path.join(md_filepath, src))print(f"在此路径中的所有.md文件中总共找到的所有图片{len(references)}张\n")
hyperlink_pattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\$\$,]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')
print("寻找到的超链接:")
print([item for item in references if hyperlink_pattern.search(item)])
# C:\Users\asssio\Desktop\mark
# 删除包含超链接的元素
references_new = [item for item in references if not hyperlink_pattern.search(item)]
print(f"在此路径中的所有.md文件中总共找到引用图片{len(references_new)}张")
print("寻找到的实际链接:")
print(references_new)usedImages = set()
for each in references_new:usedImages.add(each.split('/')[-1])# 获取.assets目录的路径
assets_filepath = input("请输入.assets目录的路径: ")# 遍历.assets目录中的所有文件,将未被引用的图片移动到 delete 目录中
if not os.path.exists(os.path.join(assets_filepath, 'delete')):os.mkdir(os.path.join(assets_filepath, 'delete'))allImageNum = 0
deleteNum = 0
for file in os.listdir(assets_filepath):allImageNum += 1# print(file)if file not in usedImages:shutil.move(os.path.join(assets_filepath, file), os.path.join(assets_filepath, 'delete'))print(f"移动图片{file}到delete文件夹中")deleteNum += 1print(f"assert文件夹中总共有图片{allImageNum}张\n总共移动{deleteNum}张图片到delete中")

运行结果

在这里插入图片描述

http://www.lryc.cn/news/399901.html

相关文章:

  • 【ceph】ceph-mon重新选举的情况
  • PopClip(Mac 划词增强工具)值得购买吗?
  • Python | Leetcode Python题解之第227题基本计算器II
  • redis源码分析之底层数据结构(一)-动态字符串sds
  • 路由协议的优先级,以及管理距离 AD 和 metric 的区别
  • 力扣 24两两交换链表中节点
  • C# + halcon 联合编程示例
  • 【Git基本操作】添加文件 | 修改文件 | 及其各场景下.git目录树的变化
  • Aop切面编程(2)--代理模式
  • Spring Boot(八十):Tesseract实现图片文字自动识别
  • QT 图片处理
  • Linux C++ 053-设计模式之模板方法模式
  • 【Python 项目】类鸟群:仿真鸟群
  • 基于信号处理的PPG信号滤波降噪方法(MATLAB)
  • 新一代信息技术及应用
  • SVN 解决冲突
  • 机器人前沿--PalmE:An Embodied Multimodal Language Model 具身多模态大(语言)模型
  • 编程语言都是哪些人开发出来的?为什么都是国外较小国家的人
  • 【前端速通系列|第二篇】Vue3前置知识
  • ES6 Module 的语法(十二)
  • Redis 主从复制,哨兵与集群
  • CV05_深度学习模块之间的缝合教学(1)
  • 【密码学】公钥密码的基本概念
  • 【前端项目笔记】10 项目优化上线
  • Qt基础控件总结—多页面切换(QStackWidget类、QTabBar类和QTabWidget类)
  • 团队融合与业务突破
  • mybatilsplaus 常用注解
  • vue引入sm-crypto通过sm4对文件进行加解密,用户输入密码
  • vue3实现无缝滚动列表(大屏数据轮播场景)
  • element ui ts table重置排序