当前位置: 首页 > article >正文

复制与图片文件同名的标签文件到目标路径

引言:在数据集构建中,我们经常需要挑选一些特殊类型的图片(如:零件中有特殊脏污背景的图片,写论文的时候想单独对这类情况进行热力图验证)。我们把挑选出来的图片放到一个文件夹下,这时候我想快速得到挑出图片对应的标签,如果一个一个在原来的大文件夹中寻找同名标签非常麻烦,这时候就可以使用以下脚本:

代码实现

import os
import shutildef copy_matching_labels(img_dir, label_dir, target_dir):"""复制与图片文件同名的标签文件到目标路径参数:img_dir: 图片文件夹路径label_dir: 原始标签文件夹路径target_dir: 目标文件夹路径"""# 支持的图片扩展名image_extensions = ['.jpg', '.jpeg', '.png', '.bmp', '.tiff', '.webp']# 确保目标目录存在os.makedirs(target_dir, exist_ok=True)# 获取图片文件列表(不含扩展名)image_files = []for file in os.listdir(img_dir):file_base, ext = os.path.splitext(file)if ext.lower() in image_extensions:image_files.append(file_base)# 复制匹配的标签文件copied_count = 0for label_file in os.listdir(label_dir):if label_file.endswith('.txt'):label_base = os.path.splitext(label_file)[0]if label_base in image_files:src_path = os.path.join(label_dir, label_file)dst_path = os.path.join(target_dir, label_file)shutil.copy2(src_path, dst_path)copied_count += 1print(f"已复制: {label_file}")print(f"\n操作完成! 共复制 {copied_count} 个标签文件")print(f"图片文件数量: {len(image_files)}")print(f"目标目录: {os.path.abspath(target_dir)}")if __name__ == "__main__":img = "C:/Users/admin/Desktop/新建文件夹"   # 选出来的图片文件夹labels = "E:/数据集/labels/val"   # 原数据集的标签文件夹target = "C:/Users/admin/Desktop/新建文件夹 (2)"   # 新的标签文件夹copy_matching_labels(img_dir=img,label_dir=labels,target_dir=target)
http://www.lryc.cn/news/2404525.html

相关文章:

  • 【深度学习-Day 24】过拟合与欠拟合:深入解析模型泛化能力的核心挑战
  • [ElasticSearch] DSL查询
  • iview中的table组件点击一行中的任意一点选中本行
  • 《探秘跨网段局域网IP广播:解锁网络通信的新姿势》
  • Kafka 单机部署启动教程(适用于 Spark + Hadoop 环境)
  • maven微服务${revision}依赖打包无法识别
  • 2025年06月07日Github流行趋势
  • WPS中将在线链接转为图片
  • 实战二:开发网页端界面完成黑白视频转为彩色视频
  • 二元函数可微 切平面逼近 线性函数逼近
  • vue生成二维码图片+文字说明
  • 机器学习监督学习实战五:六种算法对声呐回波信号进行分类
  • ​React Hooks 的闭包陷阱问题
  • 力扣面试150题--克隆图
  • 【HarmonyOS 5】运动健康开发实践介绍以及详细案例
  • STM32开发中,线程启动异常问题排查简述
  • SQL进阶之旅 Day 18:数据分区与查询性能
  • 鸿蒙PC,有什么缺点?
  • 前端工具:Webpack、Babel、Git与工程化流程
  • 使用Python和Scikit-Learn实现机器学习模型调优
  • 灰狼优化算法MATLAB实现,包含种群初始化和29种基准函数测试
  • go语言学习 第7章:数组
  • PDF图片和表格等信息提取开源项目
  • 《Progressive Transformers for End-to-End Sign Language Production》复现报告
  • Haystack:AI与IoT领域的全能开源框架
  • OpenWrt:使用ALSA实现边录边播
  • ​链表题解——回文链表【LeetCode】
  • CSS6404L 在物联网设备中的应用优势:低功耗高可靠的存储革新与竞品对比
  • Java Stream 高级实战:并行流、自定义收集器与性能优化
  • 计算机视觉——相机标定