当前位置: 首页 > news >正文

论文:IoU Loss for 2D/3D Object Detection

摘要:在2D/3D目标检测任务中,IoU (Intersection-over- Union)作为一种评价指标,被广泛用于评价不同探测器在测试阶段的性能。然而,在训练阶段,通常采用常见的距离损失(如L1或L2)作为损失函数,以最小化预测值与真实值边界盒(Bbox)之间的差异。为了消除训练和测试之间的性能差距,在[1]和[2]中引入了IoU损失用于二维目标检测。不幸的是,所有这些方法都只适用于轴对齐的二维Bboxes,而不能应用于更一般的旋转Bboxes的目标检测任务。为了解决这个问题,我们首先研究了两个旋转Bbox的IoU计算,然后实现了一个统一的框架,IoU损失层用于二维和三维目标检测任务。通过将实现的 IoU损失集成到几个最先进的3D物体探测器中,在公共KITTI[3]基准上,2D检测和点云3D检测都取得了一致的改进。

  • 记录这篇文章的原因,首先作者提出的iou理论上较于传统的更客观,其次他没公开源码,但是github有人进行了复现,论文中说要会提供源码这么多年了都没提供,挺难评的,但是还是感谢开源的力量,这里贴出别人非官方实现,实测代码没问题,用于学习和复现论文这篇论文还是有价值的。

引言

本文的主要贡献可以概括为:

  • 我们研究了两个旋转2D和3D Bboxes的IoU损失计算;
  • 我们为一般的2D和3D物体检测任务提供了一个统一的、独立于框架的IoU丢失层。
  • 通过将IoU损耗层集成到几个最先进的3D物体检测框架中,如SEC-OND, PointPillars和Point R-CNN,其优势已在公共KITTI 3D物体检测基准上得到验证。

IOU

在这里插入图片描述

  • 大多数2D检测任务都如图左边所示,通过计算得到iou配合数学函数max、min等,伪代码如下所示:轴向BBOX
    在这里插入图片描述
旋转BBOX
  • 如图的右边所示,轴向对齐的盒子并不适合在3D中表示目标物体,比如LiDAR点云中的物体,伪代码如下 在这里插入图片描述

IOU loss

在[1]和[2]中,IoU作为损失函数对于二维轴向BBox回归任务的有效性已经得到了很好的证明。从理论上讲,它也应该适用于旋转的BBox,因为唯一的区别是旋转的计算过程比轴对齐的计算过程更复杂。与[2]类似,我们将IoU损失定义为
在这里插入图片描述

针对旋转角度计算
  • forward
      1. 计算Bd和Bg的面积,其中Bd和Bg分别代表预测的和真实的BBox;
    • 在这里插入图片描述
      1. 确定Bd与Bg相交区域的顶点,有两种方法:一种是从两个BBox的边相交,另一种是从位于另一个BBox内的BBox的角。如果顶点不存在,则IoU值为零。
      1. 理论上,这些顶点形成一个凸壳。为了计算这个凸包的面积,我们需要按照逆时针(或顺时针)的顺序对顶点进行排序。首先,计算这些顶点的中心点。然后,计算每个顶点与中心形成的旋转角度。最后,通过旋转角度对顶点进行排序。
      1. 然后,通过将其划分为小的单个三角形来获得相交面积。根据Eq.(2)计算IoU值,通过Eq.(4)计算LIoU。
补充:GIOU

作为IoU的广义版本,GIoU已在b[2]中提出,用于处理两个形状没有相交的情况。在GIoU中,给出了确定两个不相交盒体之间距离的定义。一般来说,对于任意两个凸形状A, B,最小面积边界形状C定义为:同时包围A和B的最小凸形状。通常,C应与A和B共享相同的形状类型,以便于计算。最后,式中U = AreaA + AreaB−Areaoverlap。将GIoU定义为
在这里插入图片描述

http://www.lryc.cn/news/497011.html

相关文章:

  • 2411mfc,修改按钮颜色
  • 互联网 Java 面试八股文汇总(2025 最新整理)
  • 如何在 Ubuntu 中更新 Linux 内核
  • FilterListenerAjax
  • 27. 移除元素 C++
  • 大模型专栏--Spring Ai Alibaba介绍和功能演示
  • Redis设计与实现第17章 -- 集群 总结2(执行命令 重新分片)
  • 微服务搭建----springboot接入Nacos2.x
  • 3.建立本地仓库及常用命令
  • linux arm下获取屏幕事件(rk3588)
  • 【机器学习】人工智能与气候变化:利用深度学习与机器学习算法预测和缓解环境影响
  • 物联网射频识别和RFID开发(二):RFID原理及硬件组成
  • LeetCode763. 划分字母区间(2024冬季每日一题 23)
  • python调用GPT-4o实时音频 Azure OpenAI GPT-4o Audio and /realtime
  • Hadoop生态圈框架部署 伪集群版(四)- Zookeeper单机部署
  • LuaJava
  • Maven下载安装、环境配置(超详细)(包括Java环境配置(Windows)、在IDEA中配置Maven)
  • Python中的实例方法、静态方法和类方法三者区别?
  • 【学习Go编程】
  • Linux系统:网络
  • shodan2-批量查找CVE-2019-0708漏洞
  • 面向对象(二)——类和对象(上)
  • Redis3——线程模型与数据结构
  • linux 获取公网流量 tcpdump + python + C++
  • C++知识整理day3类与对象(下)——赋值运算符重载、取地址重载、列表初始化、友元、匿名对象、static
  • pytest(二)excel数据驱动
  • python蓝桥杯刷题3
  • 基于PySpark 使用线性回归、随机森林以及模型融合实现天气预测
  • Day 30 贪心算法 part04
  • dns实验3:主从同步-完全区域传输