当前位置: 首页 > news >正文

跟李沐学AI:目标检测、锚框

边缘框

用于表示物体的位置,一个边缘框通过四个数字定义:(坐上x, 左上y, 右下x, 右下y)或(左上x, 左上y, 宽, 高)

通常物体检测或目标检测的数据集比图片分类的数据集小很多,因为物体检测数据集标注成本高很多。

目标检测数据集

目标检测数据集一般每行表示一个物体,每行分别有图片文件名、物体类别、边缘框。

COCO是目标检测中常用的数据集:COCO - Common Objects in Context。该数据集包含80类物体、330K张图片以及1.5M个物体

目标检测总结

物体检测或目标检测之别图片中多个物体的类别和位置。

位置常用边缘框表示。

锚框

boudingbox是目标在图像中的真实位置,锚框是算法对目标位置的猜测。

一类目标检测算法是基于锚框。算法首先提出多个锚框,随后算法预测每个锚框内是否含有我们需要检测的物体,如果含有,预测这个锚框到真实边缘框的偏移。

IoU-交并比

IoU用来计算两个框之间的相似度。

交并比为0表示两个框之间无重叠,1则表示完全重合。 公式表示如下:

赋予锚框标号

每个锚框是一个训练样本。每个锚框要么标注为背景,要么关联上一个真实边缘框。算法会生成大量的锚框,但真实的边缘框很少,绝大数的锚框都是背景,故导致大量的负样本。

一个例子

假设该矩阵为一个图像,该图像有四个边缘框和九个锚框。每个锚框计算IoU值。跳出最大的IoU值,本例中假设为X_{23},则将边缘框3赋值给锚框2作为锚框2的标号。随后将X_{23}所对应的行、列删除。

同理,选出次最大值,样例中为X_{71}将边缘框1赋值给锚框7,随后删除对应行、列。重复直至所有边缘框都被赋值。

使用非极大值抑制(NMS)输出

每个锚框预测一个边缘框。每个预测的精度可能不同。NMS可以合并相似的预测:首先选中非背景类的最大预测值,去掉所有其它与他IoU值大于\theta的预测值,即去掉与它高度重合的锚框。重负上述过程直至所有预测被选中或去除。

 锚框总结

一类目标检测算法基于锚框进行预测。

首先生成大量锚框并赋予标号,每个锚框作为一个样本进行训练。

在预测时,使用NMS去除冗余的预测。

http://www.lryc.cn/news/425499.html

相关文章:

  • 【鸿蒙学习】HarmonyOS应用开发者基础 - 构建更加丰富的页面(一)
  • 机器学习深度学习中的Warmup技术是什么?
  • ECMAScript6中的模块:export导出、import导入
  • mysql写个分区表
  • Hystrix——服务容错保护库
  • 【区块链+金融服务】河北股权交易所综合金融服务平台 | FISCO BCOS应用案例
  • [图解]需要≠需求-《分析模式》漫谈
  • 刷到好听的音频怎么办
  • 怎么在网络攻击中屹立不倒
  • 详解 Python 中的面向对象编程(2)
  • 数据结构-线性表-顺序表
  • AI绘画大模型-StableDiffusion最强模型sd3(本地安装方法)
  • SpringBoot调用外部接口的几种方式
  • MySQL:information_schema查找某个表的主键是否在数据的其他位置出现之二
  • Linux进程和计划任务管理
  • 【Angular18】封装自定义组件
  • 【流媒体】RTMPDump—RTMP_ConnectStream(创建流连接)
  • MySQL学习3之锁机制
  • 2004-2023年上市公司过度负债数据(含原始数据+计算结果)
  • [机器学习]--KNN算法(K邻近算法)
  • 跨平台控制神器Escrcpy,您的智能生活助手
  • AR 眼镜之-开关机定制-实现方案
  • 论文阅读-Transformer Layers as Painters
  • 【STL】vector模拟实现
  • 静态成员static关键字
  • 本地项目git同步到线上
  • Allegro如何导入DXF结构文件并生成板框(1)?
  • Word密码忘记怎么办?三个密码找回工具帮你轻松找回密码
  • 使用 ABP 框架 (ASP.NET Boilerplate Project) 创建一个带有迁移功能的示例
  • WPF图表控件库