当前位置: 首页 > news >正文

SSD目标检测

数据集以及锚框的处理

数据集:

图像:(batch_size , channel , height , width)

bounding box: (batch_size , m , 5)

m: 图像中可能出现的最多边界框的数目

5: 第一个数据为边界框对应的种类,对于少于m个边界框的图像,为了保持数据的统一,需要填充非法边界框,此时将其标为-1,并在后面计算中舍弃。剩余四个数据为边界框的左上角和右下角坐标。

在训练数据中标注锚框:

在训练集中,我们将每个锚框视为一个训练样本。

首先,在图片中使用不同的方法生成大量锚框。接着使用数据集中的真实边界框与锚框的交并比来为每一个锚框标记类别和偏移量。

 
 

SSD模型

模型结构:

首先,使用基本网络块从图像中抽取特征,再逐步将其使用卷积和池化将特征图宽高减半,最终使用全局最大池将高度和宽度都降到1。

锚框构造:

我们对每一个特征图的每一个像素生成不同宽高比的锚框。当特征图尺寸越小,映射到原图的锚框越大,这样我们可以搜素不同大小的物体。
diyigetup

请添加图片描述

锚框的种类和偏移量预测:

对于种类和偏移量的预测使用不同通道来表示:

具体来说对于一个2x2的特征图假设每一个像素生成3个锚框,对于这个特征图一共有12个锚框。假设我们一共要预测3个种类,我们使用卷积生成 12x(3+1)(+1是指将锚框标注为背景) 个通道的2x2结果。例如第一个通道的第一个像素表示为特征图第一个像素生成的第一个锚框预测为第一个种类的概率。

相同的我们对偏移量的预测一共生成12x4个通道来表示预测结果。

 

最终网络如下所示:

请添加图片描述

我们使用交叉熵损失函数来对每一个锚框的预测种类和真实值求loss,对于每一个锚框的偏移量使用L1范数损失来求其loss。

http://www.lryc.cn/news/63765.html

相关文章:

  • SpringBoot项目结构及依赖技术栈
  • crash怎么分析kdump core文件
  • 微内核与宏内核的区别和联系
  • 都什么年代了,还在用Excel和ACCESS做应用系统?快来学Eversheet
  • 【JAVAEE】JAVA数据库连接(JDBC)
  • Nestjs全网最佳翻译-概况-守卫-Guards
  • 【软考网络管理员】2023年软考网管初级常见知识考点(3)- 网络体系结构
  • javascript正则表达式大括号、中括号、小括号的作用以及应用场景
  • 5年测试老鸟总结,自动化测试的实施到落地,看这一篇足够...
  • 通达信顾比倒数线指标公式,信号不漂移
  • 网络安全: CIDR无类别路由
  • NetMQ | 发布订阅时使用含通配符的Topic
  • 行为型模式-模板方法模式
  • IPsec中IKE与ISAKMP过程分析(快速模式-消息1)
  • PostgreSQL 数据类型转换
  • 【Java笔试强训 1】
  • 你买票了吗?五一火车票发售量创历史新高,车票总发售2209万张票
  • DiffUtil的使用
  • 【Python】【进阶篇】18、Django初始化项目环境精讲
  • Web前端基础
  • ACM 1007 | 分段函数求值
  • ChatGPT技术原理 第十四章:未来发展方向
  • 大型水利投资集团,打造数智财资管理新范式
  • 【java】彻底剖析 Synchronized
  • 有反爬机制就爬不了吗?那是你还不知道反反爬,道高一尺魔高一丈啊
  • 手把手教你本地CPU环境部署清华大模型ChatGLM-6B,利用量化模型,本地即可开始智能聊天,达到ChatGPT的80%
  • FFmpeg 自定义IO CONTEXT实现音频解码,以及seek函数
  • 技能升级(2023寒假每日一题 13)
  • 低频量化之 可转债 配债数据及策略 - 全网独家
  • Code area 和Data area的区别