当前位置: 首页 > news >正文

2022最新版-李宏毅机器学习深度学习课程-P25 Spacial Transformer Layer

data augmentation/spacial transformer

CNN 并不能够处理影像放大缩小,或者是旋转的问题。所以在做影像辨识的时候,往往都要做 Data Augmentation,把你的训练数据截一小块出来放大缩小、把图片旋转,CNN 才会做到好的结果。

有一个架构叫 spacial Transformer Layer可以处理。

设计一个层,需要的地方=1,不要的地方=0

经过一个NN,FP发生平移

还可以放大或缩小,只需要改变参数

旋转一共需要6个参数

当6个参数全部设定的是整数时,结果比较好处理

但如果是小数时呢?通过最终答案的四舍五入得到结果。但此时梯度也不好计算。

可以这样假设:假设最终结果发生一些微小的变化,四舍五入后得到的结果是一样的,这就说明梯度几乎=0!!

使用插值方法代替四舍五入

最终结果与周围四个值都有关。此时输出值的变化时刻影响最终结果。

把ST看成橙色,它可以放在很多地方。

这个视频的含义是改变一些输入后(变大 变小 左右旋转),经过ST层,输出结果基本不变。

实例

这里用了single ST和multi ST,效果有些变化

这个例子用了2层和4层的ST,输入图片有两种大小规格。

2层的是只识别鸟嘴和鸟翼;4层还识别了其他地方。

http://www.lryc.cn/news/197118.html

相关文章:

  • 轻松上手,制作电子期刊就这么简单
  • 网络电视机顶盒怎么样?内行揭晓网络电视机顶盒排名
  • 2023秋招华为技术岗线上面试经历
  • 保姆级VitrualBox下载ubantu
  • 【学习笔记】RabbitMQ-6 消息的可靠性投递2
  • 黑豹程序员-知识点-写一个bat一次执行多条命令
  • 从头开始机器学习:线性回归
  • 1-k8s1.23.6-底座搭建-基于docker
  • 【SA8295P 源码分析 (一)】76 - Thermal 功耗 之 /dev/thermalmgr 相关调试命令汇总
  • 每日汇评:随着上升趋势的恢复,黄金在1950美元上方等待破位
  • postgresql字符串处理的函数
  • (1)攻防世界web-Training-WWW-Robots
  • list.set交换数据需要(or不需要)添加其他中间变量,两个例子告诉你
  • Linux中的主要系统调用
  • 在vscode中配置git bash终端、git 源码管理
  • (三十四)大数据实战——scala运行环境安装配置及IDEA开发工具集成
  • Double 4 VR智能互动教学系统的教学应用
  • GPU 驱动下载记录
  • KILM: Knowledge Injection into Encoder-Decoder Language Models
  • 205、使用消息队列实现 RPC(远程过程调用)模型的 服务器端 和 客户端
  • C++中的函数
  • java操作时间的方式
  • 上网冲浪发现多处XSS
  • 机器学习的打分方程汇总
  • 一文了解数据管理框架以及数据战略制定方法
  • 智能管家“贾维斯”走进现实?AI Agent或成2023科技领域新风向标
  • 【广州华锐互动】VR高层小区安全疏散演练系统
  • 用Python做一个文件夹整理工具
  • Tortoise SVN 察看本地缓存密码
  • MSP430F5529晶振配置