当前位置: 首页 > news >正文

Mobile Vision Transformer-based Visual Object Tracking

论文作者:Goutam Yelluru Gopal,Maria A. Amer

作者单位:Concordia University

论文链接:https://arxiv.org/pdf/2309.05829v1.pdf

项目链接:https://github.com/goutamyg/MVT

内容简介:

1)方向:目标跟踪算法

2)应用:大规模数据集上的目标跟踪

3)背景:近年来,引入了强大的骨干网络(如Vision Transformers),提高了目标跟踪算法的性能。然而,这些最先进的跟踪器在计算上很昂贵,因为它们具有大量的模型参数,并依赖于专用硬件(如GPU)进行更快的推理。另一方面,最近的轻量级跟踪器速度快,但准确性较低,特别是在大规模数据集上。

4)方法:本次工作,作者首次提出了一种使用Mobile Vision Transformers(MobileViT)作为骨干网络的轻量级、准确和快速跟踪算法。还提出了一种新的方法,将模板和搜索区域的表示融合在MobileViT骨干网络中,从而为目标定位生成优秀的特征编码。

5)结果:实验结果表明,基于MobileViT的跟踪器MVT在大规模数据集GOT10k和TrackingNet上的性能超过了最近的轻量级跟踪器,并具有较高的推理速度。此外,该方法在GPU上的模型参数数量只有DiMP-50跟踪器的4.7倍,并以2.8倍的速度运行,但性能却更好。跟踪器的代码和模型可在https://github.com/goutamyg/MVT上获得。

 

http://www.lryc.cn/news/166110.html

相关文章:

  • HTTP反爬困境
  • 从零开始探索C语言(九)----函数指针与回调函数
  • 智慧工厂的基础是什么?功能有哪些?
  • LeetCode 238. 除自身以外数组的乘积
  • 点击劫持概念及解决办法
  • 【Spring】手动实现Spring底层机制-问题的引出
  • Java - List 去重,获取唯一值,分组列出所属对应集合
  • 离散高斯抽样(Discrete Gaussian Sampling)
  • Elasticsearch:什么是生成式人工智能?
  • 责任链模式让我的代码精简10倍?
  • Draw软件安装下载
  • uniapp代码混淆ios上架43问题
  • Linux目录遍历函数
  • 数据库-理论基础
  • 【已解决】src/spt_python.h:14:20: 致命错误:Python.h:没有那个文件或目录
  • 基于Face++网络爬虫+人脸融合算法智能发型推荐程序——深度学习算法应用(含Python及打包exe工程源码)+爬虫数据集
  • Jetson nano嵌入式平台配置ip记录
  • 前端中的跨域请求及其解决方案
  • SpringBoot2.0(mybatis-plus初始使用)
  • 游戏视频录制软件对比,哪款最适合你的需求?
  • 耐蚀合金连续油管最新版 学习记录
  • LoGoNet:基于局部到全局跨模态融合的精确 3D 目标检测
  • Python 多线程、线程池、进程池
  • 深入浅出了解华为端到端交付流程的概念和5个关键点
  • [Linux]进程信号
  • PostgreSQL 数据类型
  • 智慧港口4G+UWB+GPS/北斗RTK人员定位系统解决方案
  • 实时时钟和日历电路芯片MS85163/MS85163M
  • 【Java从入门到精通】这也许就是Java火热的原因吧!
  • zTasker—简洁易用强大的定时热键一体自动化工具,效率倍增器