当前位置: 首页 > news >正文

YOLOv9改进,YOLOv9引入CAS-ViT(卷积加自注意力视觉变压器)中AdditiveBlock模块,二次创新RepNCSPELAN4结构


在这里插入图片描述


摘要

CAS-ViT 是一种为高效移动应用设计的视觉Transformer。模型通过结合卷积操作与加性自注意机制,在保持高性能的同时显著减少计算开销,适合资源受限的设备如手机。其核心组件 AdditiveBlock 通过多维度信息交互和简化的加性相似函数,实现了高效的上下文信息整合,避免了传统多头自注意机制(MSA)的复杂运算。
在这里插入图片描述


# 理论介绍

AdditiveBlock 模块结合了卷积操作与加性自注意机制,以提升视觉任务的性能与计算效。AdditiveBlock 的设计如下:

  • 多信息交互:CAS-ViT 认为Token Mixer 获取全局上下文信息的能力依赖于多维度的信息交互,包括空间和通道域。
  • 加性相似函数:引入一种新颖的加性相似函数,通过简单高效的操作实现上下文信息的整合,避免复杂的矩阵运算。

AdditiveBlock 包含 Integration 子网、CATM 和 MLP 三个部分,并使用残差连接。Integration子网由三个 ReLU 激活的深度卷积层组成。通过调整通道数和块的数量,形成了轻量级的ViT模型族。
CAS-ViT结构如下图(摘自论文):

在这里插入图片描述

理论详解可以参考链接:论文地址
代码可在这个链接找到:代码地址
下文都是手把手教程,跟着操作即可添加成功


目录

  • 摘要
  • # 理论介绍
  • 🎓一、YOLOv9原始版本代码下载
    • 🍀🍀1.yolov9模型结构图
    • 🍀🍀2.环境配置
  • 🎓二、AdditiveBlock代码
  • 🎓三、添加方法
  • <
http://www.lryc.cn/news/493884.html

相关文章:

  • HDLCPPP原理与配置
  • react + vite 中的环境变量怎么获取
  • 知识蒸馏中有哪些经验| 目标检测 |mobile-yolov5-pruning-distillation项目中剪枝知识分析
  • Oracle 19c RAC单节点停机维护硬件
  • Linux系统 进程
  • 机载视频流回传+编解码方案
  • Ubuntu 20.04 Server版连接Wifi
  • 【VRChat 改模】开发环境搭建:VCC、VRChat SDK、Unity 等环境配置
  • 人工智能的微积分基础
  • Android 基础类(01)- Thread类 - readyToRun和threadLoop
  • C++设计模式之构造器
  • 红日靶场-5
  • 做异端中的异端 -- Emacs裸奔之路3: 上古神键Hyper
  • Java多线程介绍及使用指南
  • HarmonyOS 5.0应用开发——列表(List)
  • 自动化电气行业的优势和劣势是什么
  • 第 42 章 - Go语言 设计模式
  • 【机器学习】---大语言模型
  • 挑战用React封装100个组件【002】
  • MarkDown-插入图片-图片url地址的生成获取方法
  • 插值、拟合和回归分析的相关知识
  • 【小白学机器学习42】进行多次抽样,样本的分布参数和总体的分布参数的关系
  • 链动星海 质引未来|中信银行加码科技金融 “接力式”服务助力“新质生产力”释放
  • 黑马2024AI+JavaWeb开发入门Day02-JS-VUE飞书作业
  • 云计算基础-期末复习
  • Java GET请求 请求参数在Body中使用Json格式传参
  • AI数据分析工具(一)
  • go结构体匿名“继承“方法冲突时继承优先顺序
  • 【049】基于51单片机语音录放【Proteus仿真+Keil程序+报告+原理图】
  • 《软件项目管理》期末-复习题及参考答案