当前位置: 首页 > news >正文

MS COCO数据集介绍

MS COCO数据集介绍

MS COCO全称是Microsoft Common Objects in Context,是由微软开发维护的大型图像数据集,包括不同检测任务:

  • Object Detection([主要处理人、车、大象等])

在这里插入图片描述

  • DensePose(姿态密度检测)

在这里插入图片描述

  • Keypoints(关键点检测)

在这里插入图片描述

  • Stuff([主要处理草、墙、天等])

在这里插入图片描述

  • Panoptic(场景分割)

在这里插入图片描述

  • Captions(字幕标注)

在这里插入图片描述

MS COCO数据格式

MS COCO使用JSON存储标注数据
所有MS COCO的标注数据第一层都至少包含以下四个对象,不同检测任务的annotations不同且部分检测任务还包含一个categories(JSON第一层即包含五个对象)

{"info": info, "images": [image], "annotations": [annotation], "licenses": [license],
}

这里以关键点检测的验证集为例,查看它的json内容

import json
json_path = r"D:\Python\Jupyter\pytorch\yolov8\MS COCO\annotations\person_keypoints_val2017.json"
json_labels = json.load(open(json_path, "r"))

第一层结构如下,包含infolicensesimagesannotationscategories,共五个对象

在这里插入图片描述

info保存数据集的信息

在这里插入图片描述

licenses保存数据集的许可协议

在这里插入图片描述

images保存每张图片的信息,如图片文件名、宽、高等信息

在这里插入图片描述

annotations保存标注信息:

参数参数含义
segmentation保存polygon数据
num_keypoints表示给定对象的标记关键点数量(对象集合或小对象的num_keypoints值为0)
area保存目标面积
iscrowd值为0表示单个对象,值为1表示对象集合
keypoints是一个长度为3k的数组,其中k是定义的关键点类别总数(在MS COCO中k=17)。每个关键点按顺序依次存储横坐标x,纵坐标y和关键点可见性v。v=0:未标记(此情况下,x=y=0),v=1:标记但不可见,v=2:标记且可见。如果关键点位于上面segmentation的框内,则该关键点被视为可见
image_id表示MS COCO数据集的图片id
bbox保存边界框(bounding box)左上角点的横纵坐标、宽度和高度
category_id表示类别id
id表示label的id,也就是每一个label(人、等车实例对应的bbox)都有一个和它一一对应的id。一个image_id可以对应多个id(一张图片上有多个label),而一个id只能对应一个image_id

在这里插入图片描述

categories保存类别信息:

在这里插入图片描述

关键点检测的JSON结构如下:

{"info" : {"year" : int, "version" : str, "description" : str, "contributor" : str, "url" : str, "date_created" : datetime,},"licenses" : {"id" : int, "name" : str, "url" : str,},"images" : {"id" : int, "width" : int, "height" : int, "file_name" : str, "license" : int, "flickr_url" : str, "coco_url" : str, "date_captured" : datetime,}, "annotations" : {"segmentation" : RLE or [polygon],"num_keypoints" : int,"area" : float,"iscrowd" : 0 or 1,"keypoints" : [x1,y1,v1,...],"image_id" : int,"bbox" : [x,y,width,height],"category_id" : int,"id" : int,}, "categories" : {"supercategory" : str,"id" : int,"name" : str,"keypoints" : [str], "skeleton" : [edge], },
}

参考资料

  1. https://cocodataset.org/#format-data
  2. MS COCO数据集介绍以及pycocotools简单使用
  3. MSCOCO api详解 —— Keypoints
  4. 目标检测数据集MSCOCO详解
http://www.lryc.cn/news/68502.html

相关文章:

  • Java之线程池
  • 让你的网站变得更智能 - B2 Pro主题问答模块新增OpenAI ChatGPT机器人自动回答功能
  • 仓库信息管理系统设计与实现
  • 初识Java多线程编程
  • 最新入河排污口设置论证、水质影响预测与模拟、污水处理工艺分析及典型建设项目入河排污口方案报告书实例分析
  • awk指令的详细指南
  • 解密Netty中的Reactor模式
  • 这是一个黑科技:C++爬虫~(文末报名C/C++领域新星计划)
  • 2023 年第八届数维杯数学建模挑战赛 赛题浅析
  • Spring Boot单元测试
  • 实景三维浪潮翻涌,新技术“席卷”石家庄!
  • 【Python】使用小脚本
  • 技术日志2023-5-18
  • JUC之锁
  • C++中的 cout 和 printf 用法
  • Maven基础使用
  • 【C++ 入坑指南】(06)运算符
  • 了解一下js中的函数式编程
  • 动态HTTP代理在linux里的使用
  • 软考证书值得考吗?怎么考?
  • 超级秘密文件夹忘记密码的解决办法
  • 脑的物理系统
  • 1054. 距离相等的条形码(leetcode,堆问题,priority_queue)-------------------c++实现
  • QT开发实战-动态壁纸软件
  • Netty核心组件模块(一)
  • Robot Framework+Jenkins持续集成UI自动化项目
  • 【ROS】ROS1编程速览
  • 探索智能化:TOOM解析未来稿件校验系统的技术进展与应用展望
  • Java程序员从青铜到王者,不同段位的薪资和技能变化
  • tinyWebServer 学习笔记——二、HTTP 连接处理