当前位置: 首页 > news >正文

数据集制作——语义分割前png、jpg格式标签图转yolo格式.txt文件(附代码)

💪 专业从事且热爱图像处理,图像处理专栏更新如下👇:
📝《图像去噪》
📝《超分辨率重建》
📝《语义分割》
📝《风格迁移》
📝《目标检测》
📝《暗光增强》
📝《模型优化》
📝《模型实战部署》


在这里插入图片描述

目录

  • 一、YOLO格式
  • 二、实现步骤
  • 三、代码
    • 3.1 参数修改
    • 3.2 代码
  • 四、转换结果
  • 五、总结

一、YOLO格式

YOLO格式的数据集通常包含两部分:图像文件和对应的文本标注文件。每个文本标注文件中包含了图像中每个物体的类别和位置信息。每一行代表一个物体,格式如下:

<class_id> <x_center> <y_center> <width> <height>

其中,<class_id>是物体类别的ID,<x_center>和<y_center>是物体中心点的坐标,和是物体的宽度和高度。所有的坐标和尺寸都需要被归一化,即除以图像的宽度和高度,因此它们的值都在0到1之间。

二、实现步骤

要将.png格式的标签图转换为YOLO格式的.txt文件,需要以下步骤:

(1)读取.png标签图,每个物体应该被标记为不同的颜色;

(2)解析标签图,对每种颜色进行遍历,找出所有像素点的坐标;

(3)对每种颜色的像素点坐标进行分析,计算出对应的bounding box(通过找到最小和最大的x,y坐标来实现);

(4)将bounding box的坐标和尺寸归一化,然后保存为.txt文件。

三、代码

3.1 参数修改

在这里插入图片描述

3.2 代码

注:.png格式个标签图像,必须是单通道图像。

import os
import cv2
import numpy as npdef convert_segmentation_to_yolo(img_path, output_path, num_classes):# 读取标签图img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)height, width = img.shape# 创建用于存储YOLO格式的列表yolo_labels = []# 遍历每个类别for class_id in range(num_classes):# 找到当前类别的所有像素位置class_pixels = np.where(img == class_id)# 如果当前类别不存在,跳过if len(class_pixels[0]) == 0:continue# 找到类别的最小和最大边界x_min = np.min(class_pixels[1])x_max = np.max(class_pixels[1])y_min = np.min(class_pixels[0])y_max = np.max(class_pixels[0])# 计算中心点和宽高,并归一化x_center = (x_min + x_max) / 2 / widthy_center = (y_min + y_max) / 2 / heightbbox_width = (x_max - x_min) / widthbbox_height = (y_max - y_min) / height# 保存YOLO格式的标签yolo_labels.append(f"{class_id} {x_center} {y_center} {bbox_width} {bbox_height}")# 将YOLO标签写入.txt文件txt_file = os.path.splitext(os.path.basename(img_path))[0] + ".txt"with open(os.path.join(output_path, txt_file), "w") as f:for label in yolo_labels:f.write(label + "\n")# 示例调用
# img_folder = 'path/to/your/png/folder'
# output_folder = 'path/to/your/txt/folder'
img_folder = 'Images/Segment_Images/image_png'
output_folder = 'Images/Segment_Images/label_txt'
# num_classes = 21  # 假设有21个类别
num_classes = 2  # 假设有21个类别if not os.path.exists(output_folder):os.makedirs(output_folder)# 遍历标签图文件夹并转换
for img_file in os.listdir(img_folder):if img_file.endswith('.png'):img_path = os.path.join(img_folder, img_file)convert_segmentation_to_yolo(img_path, output_folder, num_classes)

四、转换结果

下面是原始的png格式标签图和转换后的yolo格式.txt文件。

在这里插入图片描述

五、总结

以上就是语义分割前png、jpg格式标签图转yolo格式.txt文件的详细过程,希望能帮到你!

感谢您阅读到最后!😊总结不易,多多支持呀🌹 点赞👍收藏⭐评论✍️,您的三连是我持续更新的动力💖

关注公众号「视觉研坊」,获取干货教程、实战案例、技术解答、行业资讯!

http://www.lryc.cn/news/376838.html

相关文章:

  • 机器学习课程复习——ANN
  • C++回溯算法(2)
  • 流量有限、日活低的APP适合对接广告变现吗?
  • Shell 学习笔记 - 变量的类型 + 变量的赋值
  • vue播放flv格式的直播流
  • Qt入门小项目 | 实现一个图片查看器
  • qt仿制qq登录界面
  • HashMap详解(含动画演示)
  • TVS的原理及选型
  • 【机器学习】无监督学习:探索数据背后的隐藏模式
  • 使用Elasticsearch在同一索引中区分不同类型的文档
  • 驾校在线考试系统源码 手机+PC+平板自适应
  • c++的多态,继承,抽象类,虚函数表,虚函数等题目+分析
  • 利用 Qwen-VL 进行私有化部署第一个 AI 多模态大模型
  • 王思聪隐形女儿曝光
  • 学习笔记——网络管理与运维——SNMP(SNMP原理)
  • 基于STM32和人工智能的自动驾驶小车系统
  • 简单介绍vim
  • 使用本地数据对transformers模型进行微调训练
  • Java面试题:讨论何时需要创建自定义异常类,并展示如何实现一个自定义异常
  • 什么是进程
  • 电脑提示d3dcompiler_47.dll丢失的解决方法,实测靠谱的5种方法
  • SQLserver前五讲课堂笔记
  • 深度学习项目十六:根据训练好的权重文件推理图片--YOLO系列
  • 敏感信息加密操作,让开发的系统更加的安全可靠!!
  • 第四篇:精通Docker构建:Dockerfile的艺术与策略
  • Linux下Cmake安装或版本更新
  • 人工智能体验工程师面试
  • 科研——BIBM论文修改和提交
  • 【bug】配置SpringCloudAlibaba AI的maven依赖问题