当前位置: 首页 > news >正文

YOLOv8创新魔改教程(一)如何进行模块创新

YOLOv8创新魔改教程(一)如何进行模块创新

YOLOv8创新魔改教程

本人研一,最近好多朋友问我要如何修改模型创新模块,就想着不如直接开个专栏歇一歇文章,也算是对自己学习的总结,本专栏以YOLOv8为例(后续会出其他模型的),手把手叫大家如何从零创新模块,喜欢的朋友可以点个关注喽。

(一)寻找创新点

我们想对模型创新时,要首先寻找创新点,如何寻找?对于研究目标是图像的朋友,可以关注一下CVPR ICCV这些计算机视觉的会议,大多情况下,我们的创新点就来自于这些期刊。

(二)github找创新点源码

这里我以《SCConv: Spatial and Channel Reconstruction Convolution for Feature Redundancy》这篇文章为例。大家可以看到这篇文章提出了一个叫SCConv的卷积模块。在这里插入图片描述
现在大家就可以去github找创新点源码了,有的文章会提供,有的则不会,不过也没事,github总有人会发表出来,大家直接去搜就可以。(https://github.com/cheng-haha/ScConv/blob/main/ScConv.py)
在这里插入图片描述

(三)将代码整合到自己的网络中

到这一步有的同学可能会开始头疼,我代码能力不行,我不会编程等等等等,我想和大家说的是,这一步超级的简单的,只需要会复制粘贴就好了

代码一般整合的部位

在YOLOv8中,我们的代码可以添加到 ultralytics/nn/modules/block.py中,接下来我带大家走一遍流程。

如何添加

第一步,打开 ultralytics/nn/modules/block.py这个文件,直接将我们找到的代码复制进来。
在这里插入图片描述
第二步,将创新模块导入,大家要把每个class的名称导入到block的__all__ ()的括号内,ultralytics/nn/modules/init.py文件中from .block import()的括号内和__all__ = ()的括号内,一共是三处,大家不要漏掉。
在这里插入图片描述

在这里插入图片描述

进行融合

使用YOLOv8的同学可能会发现,发表的论文大多数是对c2f模块的创新,所以我也举个例子方便大家参考。大家在block.py中,找到c2f模块,可以看到,里面有四处卷积可以供我们修改,其中Bottleneck有两处。
在这里插入图片描述

在这里插入图片描述
大家在修改的时候,建议大家开个新模块,改个名字在修改,比如要修改c2f
在这里插入图片描述

(三)测试代码

修改yaml文件,在这里建议大家创建一个新的。
将c2f换成我们融合后的,当然,也可以把卷积换成新的卷积。
在这里插入图片描述
运行成功!可能会出现一些报错,无非是模块没添加成功,大家根据错误提示修改就可以。

ScConv
感谢各位的点赞与支持,下一篇会更新添加注意力机制相关内容。

http://www.lryc.cn/news/250470.html

相关文章:

  • postgresql-shared_buffers参数详解
  • windows10 Arcgis pro3.0-3.1
  • Apache Airflow (十四) :Airflow分布式集群搭建及测试
  • 解决VSCode按住Ctrl(or Command) 点击鼠标左键不跳转的问题(不能Go to Definition)
  • 使用DrlParser 检测drl文件是否有错误
  • ArcGIS中基于人口数据计算人口密度的方法
  • 在CentOS 8.2中安装Percona Xtrabackup 8.0.x备份MySql
  • javascript中的正则表达式的相关知识积累
  • 51k+ Star!动画图解、一键运行的数据结构与算法教程!
  • 4.7 矩阵的转置运算(C语言实现)
  • 快速掌握Pyqt5的9种显示控件
  • 【WP】Geek Challenge 2023 web 部分wp
  • Elasticsearch:为现代搜索工作流程和生成式人工智能应用程序铺平道路
  • 【WinForm.NET开发】Windows窗体开发概述
  • WPF 简单绘制矩形
  • crui_lvgl 一个LVGL的DSL辅助工具的设想
  • 公共部门生成式人工智能的未来
  • 【报名】2023产业区块链生态日暨 FISCO BCOS 开源六周年生态大会
  • MySQL之性能分析和系统调优
  • 时间复杂度为 O(n^2) 的排序算法 | 京东物流技术团队
  • 关于前端学习的思考-内边距、边框和外边距
  • 【linux】/etc/security/limits.conf配置文件详解、为什么限制、常见限制查看操作
  • Windows系统下更新后自带的画图软件出现马赛克bug
  • [HTML]Web前端开发技术6(HTML5、CSS3、JavaScript )DIV与SPAN,盒模型,Overflow——喵喵画网页
  • SQL练习
  • 创始人于东来:胖东来员工不想上班,请假不允许不批假!
  • C++学习之路(十五)C++ 用Qt5实现一个工具箱(增加16进制颜色码转换和屏幕颜色提取功能)- 示例代码拆分讲解
  • 【STM32】EXTI外部中断
  • Linux系统的常见命令十三,显示系统进程状态、文件权限、修改文件或目录所有者和所属组命令(ps、chmod和chown)
  • Python 批量修改文件名