当前位置：首页 > news >正文

深度学习论文: CAS-ViT: Convolutional Additive Self-attention Vision Transformers

news 2025/7/5 6:34:33

深度学习论文: CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications
CAS-ViT: Convolutional Additive Self-attention Vision Transformers for Efficient Mobile Applications
PDF:https://arxiv.org/pdf/2408.03703
PyTorch代码: https://github.com/shanglianlm0525/CvPytorch
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks

1 概述

在相关研究中，视觉 Transformer（ViT）虽凭借 token mixer 的强大全局上下文能力取得了显著进展，但也面临着 token mixer 中矩阵操作（如 Softmax）复杂度高，以及在移动设备或实时应用中难以兼顾准确性、效率和易部署性等问题。

http://www.lryc.cn/news/521869.html

相关文章：

PyCharm文档管理

QNAP 上常用的几款软件

LabVIEW智能水肥一体灌溉控制系统

提问：玩游戏输入法总弹出来咋回事哎

链家房价数据爬虫和机器学习数据可视化预测

【微服务】面试题 5、分布式系统理论：CAP 与 BASE 详解

第十二章：算法与程序设计

RAG技术：是将知识库的文档和问题共同输入到LLM中

持续集成 01|Gitee介绍、Pycharm使用Gitee

信息安全、网络安全和数据安全的区别和联系

C++实现设计模式---抽象工厂模式 (Abstract Factory)

K8S开启/关闭审计日志

css盒子水平垂直居中

px、em 和 rem 的区别：深入理解 CSS 中的单位

基于STM32设计的粮食仓库(粮仓)环境监测系统

【后端面试总结】tls中.crt和.key的关系

日拱一卒（20）——leetcode学习记录：大小为 K 且平均值大于等于阈值的子数组数目

项目练习：若依管理系统字典功能-Vue前端部分

apache-skywalking-apm-10.1.0使用

计算机视觉算法实战——视频分析（Video Analysis）

全网首发：编译libssh，产生类似undefined reference to `EVP_aes_256_ctr@OPENSSL_1_1_0‘的大量错误

用python实战excel和word自动化

【云计算】OpenStack云计算平台

好用的php商城源码有哪些？

docker安装Nginx UI

为深度学习创建PyTorch张量 - 最佳选项

详解数据增强中的平移shft操作

CCLINKIE转ModbusTCP网关，助机器人“掀起”工业智能的“惊涛骇浪”

类型安全与代码复用的C# 泛型

卷积神经05-GAN对抗神经网络