当前位置: 首页 > news >正文

Yolov8网络结构学习

 详解YOLOv8网络结构/环境搭建/数据集获取/训练/推理/验证/导出/部署

 深入解析YOLOv8:网络结构与推理过程

YOLO? You Know! --YOLOV8详解

 一:yolov8总体结构

1.Backbone:它采用了一系列卷积和 反卷积层只来提取特征,同时也使用了残差连接和瓶颈结构来减小网络的大小和提高性能。该部分采用了C2f模块作为基本构成单元,与YOLOv5的C3模块相比,C2f模块具有更少的参数量和更优秀的特征提取能力。
2.Neck:它采用了多尺度特征融合技术,将来自Backbone的不同阶段的特征图进行融合,以增强特征表示能力。具体来说,YOLOv8的Neck部分包括一个SPPF模块、一个PAA模块和两个PAN模块。
3.Head:它负责最终的目标检测和分类任务,包括一个检测头和一个分类头。检测头包含一系列卷积层和反卷积层,用于生成检测结果;分类头则采用全局平均池化来对每个特征图进行分类。

网络结构图: 

二:Backbone

YOLOv8的Backbone部分使用了C2f模块来替代了YOLOv5中的C3模块,实现了进一步的轻量化。具体来说,同时,它也保留了YOLOv5等架构中使用的SPPF(空间金字塔池化)块。

1.预处理

提取初步特征的第一个卷积层的卷积核kernel,yolov5为6x6, yolov8为3x3,感受野相比于yolov5进一步缩小。

与yolov5一样,每个卷积层的模块都采用步长为2的卷积核进行降采样操作,减少特征图的尺寸同时增加通道数。

2.C3替换成C2f

yolov5中的C3模块在yolov8中被替换为了C2f,C2f则采用了yolov7中ELAN 多层堆叠的结构,增加了更多类似resnet残差块中的跳跃连接,丰富了模型的梯度流。

在C2f模块中用到的DarknetBottleneck模块,使用多个3x3卷积核进行卷积操作,提取特征信息,同时其具有add是否进行残差链接的选项。

 

 而yolov5使用的Bottleneck是1×1和3×3卷积。

其实整个C2f模块就是一个改良版本的Darknet
首先,使用1x1卷积核将输入通道数减少到原来的1/2,以减少计算量和内存消耗。然后,使用多个3x3卷积核进行卷积操作,提取特征信息。接着,使用残差链接,将输入直接加到输出中,从而形成了一条跨层连接。最后,再次使用1x1卷积核恢复特征图的通道数。

yolo从v2起,backbone主要是Darknet。

三:Neck

Neck主要起到特征融合的作用,yolov8的neck依然采用PAN-FPN。

四:Head

 YOLOv8采用了解耦头结构,将分类和检测任务分离开来。这种设计允许模型的每个部分专注于其特定的任务,提高了分类的准确性和检测的精确性。

http://www.lryc.cn/news/402020.html

相关文章:

  • 5.5 软件工程-系统测试
  • 网络故障处理及分析工具:Wireshark和Tcpdump集成
  • UDP客户端、服务端及简易聊天室实现 —— Java
  • 下载安装nodejs npm jarn笔记
  • Calibration相机内参数标定
  • MySQL源码安装
  • gtest单元测试:进程冻结与恢复管理模块的单元测试实现
  • Flutter动画详解第二篇之显式动画(Explicit Animations)
  • python常用模块(JSON与pickle、Os模块)
  • MMLab-dataset_analysis
  • 艺术与技术的交响曲:CSS绘图的艺术与实践
  • 基于 JAVA 的旅游网站设计与实现
  • 【C++深度探索】二叉搜索树的全面解析与高效实现
  • Java实习记录 1 ——初入职场
  • opencv—常用函数学习_“干货“_3
  • 用Docker来开发
  • 从0开始的STM32HAL库学习2
  • 【MySQL篇】Percona XtraBackup工具备份指南:常用备份命令详解与实践(第二篇,总共五篇)
  • Spock单元测试框架使用介绍和实践
  • web安全之跨站脚本攻击xss
  • TCP与UDP的理解
  • 有效应对服务器遭受CC攻击的策略与实践
  • STM32判断休眠
  • TikTok内嵌跨境商城全开源_搭建教程/前端uniapp+后端源码
  • 前端学习(二)
  • 链接追踪系列-10.mall-swarm微服务运行并整合elk-上一篇的番外
  • 用Agent大模型,我发现了Prompt工程师的10大必备技能
  • 【GraphRAG】微软 graphrag 效果实测
  • 十大常用加密软件排行榜|2024企业常用加密软件推荐
  • lua 游戏架构 之 资源加载 LoaderManager (一)