当前位置: 首页 > news >正文

【Deformable Convolution】可变形卷积记录

every blog every motto: You can do more than you think.
https://blog.csdn.net/weixin_39190382?type=blog

0. 前言

可变形卷积记录

1. 正文

预印版:
Deformable Convolutional Networks v1
Deformable ConvNets v2: More Deformable, Better Results
发表版:
Deformable Convolutional Networks

1.1 简介

在这里插入图片描述

  • a普通卷积
  • b,c,d 可变卷积
    在图a标准卷积核参数中添加一个方向参数(图b绿色箭头),使得卷积核可以变为任意形状。
    其中,b,c是可变卷积的特殊形式。

1.2 为什么要用可变形卷积

我们知道,卷积核的目的是为了提取输入的特征,在传统卷积中卷积核通常是固定尺寸。这种卷积核存在的最大问题是对未知变化的适应性,泛化能力不强。

在这里插入图片描述

  • 最上层的图像是大小不同物体的激活单元
  • 中间层是为了得到顶层激活单元所进行的采样过程。
    • 左图是标准的3*3采样
    • 右图是非标准的采样,依然是3*3
  • 最下层是为了得到中间层进行的采样。

可以发现,可变形卷积在采样时更贴近物体的形状和尺寸,而标准卷积无法做到。

1.3 实现

如前所述,可变形卷积在传统卷积的基础上增加了卷积核的方向向量,使得卷积核的形态更贴近物体,那么该过程是如何实现的?

  1. 开始和正常卷积一样,利用传统卷积提取特征图
  2. 把得到的特在图作为输入,对特征图再施加一个卷积,这么做的目的是为了得到可变形卷积的偏移量
  3. 上面两个特在图相加
  4. 偏移层是2N,是因为在平面上做移动,需要改变x和y两个方向。
  5. 在训练时,用于生成特征图的卷积核和用于生成偏移量的卷积核是同步学习的

注意: 特征图里面的值是浮点数,而坐标是整数。这里面需要涉及到类型转换,具体参考后面链接

请添加图片描述


请添加图片描述


参考9中,介绍了v2版本增加了对偏移增加权重,比较有意思,有兴趣的可以看下。

  • v1中引入的offset是要寻找有效信息的区域位置
  • v2中引入权重系数是要给找到的这个位置赋予权重,这两方面保证了有效信息的准确提取。

参考

[1] Deformable Convolutional Networks v1
[2] Deformable ConvNets v2: More Deformable, Better Results
[3] Deformable Convolutional Networks
[4] https://blog.csdn.net/LEEANG121/article/details/104234927
[5] https://blog.csdn.net/scut_salmon/article/details/97050908
[6] https://blog.csdn.net/mykeylock/article/details/77746499
[7] https://blog.csdn.net/kevin_zhao_zl/article/details/89319756
[8] https://blog.csdn.net/jiangqixing0728/article/details/126269423
[9] https://www.jianshu.com/p/55ddeb498c65

http://www.lryc.cn/news/10586.html

相关文章:

  • Oracle-Mysql 函数转换
  • 【Kafka】一.认识Kafka
  • Linux软件管理YUM
  • 【自学MYSQL】MySQL Windows安装
  • Linux c编程之常用技巧
  • 21- 朴素贝叶斯 (NLP自然语言算法) (算法)
  • 设计模式第七讲-外观模式、适配器模式、模板方法模式详解
  • flutter-第1章-配置环境
  • “消息驱动、事件驱动、流 ”的消息模型
  • 量化股票配对交易可以用Python语言实现吗?
  • 机器学习洞察 | 一文带你“讲透” JAX
  • OpenFaaS介绍
  • 【算法设计与分析】STL容器、递归算法、分治法、蛮力法、回溯法、分支限界法、贪心法、动态规划;各类算法代码汇总
  • vue初识
  • 火山引擎入选《2022 爱分析 · DataOps 厂商全景报告》,旗下 DataLeap 产品能力获认可
  • java-spring_bean的生命周期
  • 微服务相关概念
  • 论文解读:(TransA)TransA: An Adaptive Approach for Knowledge Graph Embedding
  • js将数字转十进制+十六进制(联动el-ui下拉选择框)
  • 关于RedissonLock的一些所思
  • C++:倒牛奶问题
  • MySQL8.x group_by报错的4种解决方法
  • 具有非线性动态行为的多车辆列队行驶问题的基于强化学习的方法
  • TrueNas篇-硬盘直通
  • 手机子品牌的“性能战事”:一场殊途同归的大混战
  • dockerfile自定义镜像安装jdk8,nginx,后端jar包和前端静态文件,并启动容器访问
  • MongoDB 全文检索
  • JS中声明变量,使用 var、let、const的区别
  • 汽车改装避坑指南:大尾翼
  • 【Unity资源下载】POLYGON Dungeon Realms - Low Poly 3D Art by Synty