当前位置: 首页 > news >正文

V3Det大规模词汇视觉检测数据集与LaRS海上全景障碍物检测数据集

V3Det与LaRS是ICCV2023上发表的数据集工作,规模都比较大,后续有可能会用到,因此记录下来。

V3Det: Vast Vocabulary Visual Detection Dataset

Paper: https://arxiv.org/abs/2304.03752

URL: https://v3det.openxlab.org.cn/

在现实世界中检测任意对象的最新进展是在词汇相对有限的对象检测数据集上进行训练和评估的。为了便于开发更通用的视觉对象检测,我们提出了V3Det,这是一个庞大的词汇视觉检测数据集,在海量图像上具有精确注释的边界框。V3Det具有几个吸引人的特性:1)丰富的词汇:它包含来自真实世界图像上13204个类别的对象的边界框,比现有的大词汇对象检测数据集(例如LVIS)大10倍。2) 层次类别组织:V3Det的庞大词汇由一个层次类别树组织,该树注释了类别之间的包含关系,鼓励在庞大和开放的词汇对象检测中探索类别关系。3) 丰富的注释:V3Det包含243k张图像中的精确注释对象,以及由人类专家和强大的聊天机器人编写的每个类别的专业描述。通过提供广阔的探索空间,V3Det能够在大量和开放词汇的对象检测方面实现广泛的基准测试,为未来的研究带来新的观察、实践和见解。它有潜力成为开发更通用视觉感知系统的基石数据集。

LaRS: A Diverse Panoptic Maritime Obstacle Detection Dataset and Benchmark

Paper: https://arxiv.org/abs/2308.09618

URL: https://lojzezust.github.io/lars-dataset/

由于缺乏能够充分捕捉一般海洋环境复杂性的多样化数据集,阻碍了海洋障碍物检测的进展。我们展示了第一个海上全景障碍物探测基准LaRS,以湖泊、河流和海洋为特色。我们的主要贡献是新的数据集,它在记录位置、场景类型、障碍物类别和采集条件方面拥有相关数据集中最大的多样性。LaRS由4000多个每像素标记的关键帧和9个前帧组成,以允许利用时间纹理,总计超过40k帧。每个关键帧都用11个事物类和19个全局场景属性进行注释。我们报告了27种语义和全景分割方法的结果,以及一些性能见解和未来的研究方向。

http://www.lryc.cn/news/211607.html

相关文章:

  • ubuntu(18.04) 安装 blast
  • 3.2每日一题(定积分求抽水做工问题)
  • c语言基础:L1-063 吃鱼还是吃肉
  • <if> 标签中使用了不正确的语法。在 XML 中,<if> 标签不需要使用 <![CDATA[ ... ]]> 将条件语句包装起来。 否则会报错
  • Ubuntu 诞生 19 年
  • JVM进阶(3)
  • Qt QWidget、QDialog、QMainWindow的区别
  • 软考 系统架构设计师系列知识点之设计模式(10)
  • 【python爬虫】设计自己的爬虫 1. request封装
  • 8.0 新特性 - innodb_ddl_threads
  • pgAdmin 4 v7.8 发布,PostgreSQL 开源图形化管理工具
  • Realrek 2.5G交换机 8+1万兆光RTL8373-VB-CG方案简介
  • Linux命令随笔
  • 最新版scene-builder安装
  • 直击电商商城内核!一站式解决方案
  • rabbitmq安装、基本使用
  • Amaon CloudFront助力出海业务访问优化
  • python实现ModBusRTU服务端
  • yum安装node,npm
  • ESM蛋白质语言模型系列
  • RHCE-------Day1
  • Linux(Centos7)防火墙端口操作记录
  • 【MySQL数据库】初识MySQL数据库、安装MySQL
  • Keil Map信息解析
  • 在重生奇迹MU中如何选择最佳的挂机点?
  • IT行业中的热门职业及前景展望
  • linux练习
  • 【【带有握手信号的无符号数乘法verilog+ testbench 代码】】
  • 【Python机器学习】零基础掌握BayesianRidge贝叶斯回归
  • 【机器学习】朴素贝叶斯算法基本原理与计算案例