当前位置: 首页 > news >正文

【YOLO模型】(4)--YOLO V3超超超超详解!!!

文章目录

  • YOLO V3
    • 一、改进
    • 二、三种scale
    • 三、残差连接
    • 四、核心网络结构
      • 1. 结构
      • 2. 输出与先验框关系
    • 五、softmax层替代
  • 总结

YOLO V3

YOLO V3是由Joseph Redmon等人在2018年推出的一款目标检测算法。作为YOLO系列的第三代版本,它在实时性和准确性上取得了显著的提升。YOLO V3的核心思想是将目标检测问题转化为一个回归问题,通过一个统一的神经网络同时预测物体的类别和位置。

相较于其他的网络模型,YOLO V3有着显著的优越性以及高效性:

在这里插入图片描述

一、改进

  1. YOLO V3最大的改进就是网络架构,使其更适合小物体检测。
  2. 特征做的更细致,融入多持续特征图信息来预测不同规格物体。
  3. 先验框更丰富,共9个,分为小、中、大三种scale,每种有三个规格。
  4. softmax改进,预测多标签任务。

二、三种scale

为了检测不同大小的物体:

在这里插入图片描述

  • scale变换经典方法

不太理想的两种方法

金字塔:每层特征图卷积预测结果。

单一:将多层特征图融合在一起,这样就和普通的卷积神经网络一样了,没什么意义。

在这里插入图片描述

上述两种方法有一个缺点:不利于yolo的检测速度。

理想方法

从大的融合向小的,接着小的返回影响大的特征图输出:

在这里插入图片描述

三、残差连接

残差网络最大特点:可以搭建更大、更深层次的网络。

引入resnet的思想,堆叠更多的层来进行提取:

在这里插入图片描述

四、核心网络结构

YOLO V3采用了Darknet-53作为骨干网络。Darknet-53是一个基于ResNet残差网络思想的深度学习模型,包含53个卷积层,每个卷积层后跟随批量归一化层和Leaky ReLU激活函数。这种结构使得网络在提取特征时更加高效,同时避免了过拟合的问题。

特点:没有池化层和全连接层,只有卷积层。

1. 结构

在这里插入图片描述

2. 输出与先验框关系

从上方可以发现,网络结构共有三个输出:

YOLO3延续了K-means聚类得到先验框的尺寸方法,为每种下采样尺度设定3种先验框,总共聚类出9种尺寸的先验框。

在这里插入图片描述

五、softmax层替代

在之前的判断类别中,我们使用的是logistic函数

指的是未经过softmax函数处理的网络输出,也就是各个类别的得分(score)或概率(probability)值,因此沿用了logit这个术语。在逻辑回归(logistic regression)模型中,logits表示某个事件发生的概率与不发生的概率之比的对数值。

softmax层适用于多分类的任务中:

在这里插入图片描述

总结

本篇介绍了:

  1. YOLO V3的网络架构只有卷积层,且有三个输出。
  2. YOLO V3先验框共有9个,分为小、中、大三种scale,每种有三个规格。
  3. 引入残差网络思想,搭建更深层次的网络。
  4. 使用softmax函数替代logistic函数,适用于多分类的任务。
http://www.lryc.cn/news/471548.html

相关文章:

  • 管理类联考 信息整理和经验分享
  • JetBrains IDE中GPU进程(JCEF)重启问题(Too many restarts of GPU-process)解决方案
  • 《泛基因组:高质量参考基因组的新标准》
  • 模型其他压缩方法
  • Python学习的自我理解和想法(22)
  • 基于neo4j的糖尿病知识图谱数据
  • 分布式搜索引擎elasticsearch操作文档操作介绍
  • C++ 中的可调用对象
  • [HBase]二 HBase原生Shell命令大全
  • Kafka之消费者客户端
  • 使用Python进行数据分析入门
  • ubuntu20 从源码编译升级到版本5.15.263
  • php 程序开发分层与验证思想
  • 关于InternVL2的单卡、多卡推理
  • Go语言设计Web框架
  • 2024年10月28日练习(双指针算法)
  • Objective-C 音频爬虫:实时接收数据的 didReceiveData_ 方法
  • 提升网站流量和自然排名的SEO基本知识与策略分析
  • 雷池社区版compose文件配置讲解--fvm
  • 基于51单片机的智能断路器proteus仿真
  • (N-154)基于springboot酒店预订管理系统
  • elasticsearch 8.x 插件安装(三)之拼音插件
  • 快速遍历包含合并单元格的Word表格
  • 手机收银云进销存管理软件,商品档案Excel格式批量导入导出,一键导入Excel的商品档案
  • html 中识别\n自动换行
  • 用QWebSocketServer写websocket服务端
  • 云原生后端:现代应用架构的核心力量
  • arcgis中dem转模型导入3dmax
  • Python自动化测试中的Mock与单元测试实战
  • 物联网海量数据下的时序数据库选型:InfluxDB、TDEngine、MongoDB与HBase对比与建议