当前位置: 首页 > news >正文

(论文阅读11/100)Fast R-CNN

文献阅读笔记

简介

题目

Fast R-CNN

作者

Ross Girshick

原文链接

https://arxiv.org/pdf/1504.08083.pdf

目标检测系列——开山之作RCNN原理详解-CSDN博客

Fast R-CNN讲解_fast rcnn-CSDN博客

Rcnn、FastRcnn、FasterRcnn理论合集_rcnn fastrcnn fasterrcnn_沫念·的博客-CSDN博客

关键词

NUll

研究问题

目标检测任务背景:首先确定大量候选对象位置;其次对候选对象细化以确定目标位置。这些问题的解决往往折中了速度、精度或者简单性。

之前的方法:

RCNN提取2000个候选框冗余工作太多。

SPP算法也有缺点:仅使用log损失函数微调无法更新空间金字塔池化前的卷积层,限制了非常深的网络的准确性。

研究方法

Fast R - CNN:用全连接层分类。

ROI pooling:感兴趣区域池化。使用最大池化将任何有效感兴趣区域内的特征转换为具有固定空间范围H × W (例如, 7 × 7)的小特征映射,其中H和W是独立于任何特定RoI的层超参数。每个RoI由一个四元组特征(r,c,h,w)定义,该(r,c,h,w)指定其左上角(r,c)及其高度和宽度(h,w)。是SSp的特例,其中只有一个金字塔层。

从预训练的网络中初始化:将最后一个最大池化层替换为RoI池化层,通过设置H和W与网络的第一个全连接层(例如,对于VGG16 , H = W = 7)兼容来配置RoI池化层。其次,将网络的最后一个全连接层和softmax (分别训练用于1000 - way ImageNet分类)替换为前面描述的两个兄弟层( K + 1个类别上的全连接层和softmax以及类别特定的边界框回归)。第三,修改网络以获取两个数据输入:图像列表和这些图像中的RoIs列表。

Multi-task loss.

Mini-batch sampling.

研究结论

1.比R - CNN、SPPnet拥有更高的检测质量 2.训练是单阶段的,使用多任务损失3.训练可以更新所有的网络层4.特征缓存不需要磁盘存储

创新不足

候选区域的选择仍然不是很高效

额外知识

RCNN网络

http://www.lryc.cn/news/218155.html

相关文章:

  • Git 标签(Tag)实战:打标签和删除标签的步骤指南
  • React 底层 Fiber 架构 简单理解
  • 使用 Python 进行自然语言处理第 4 部分:文本表示
  • 【LLM】大语言模型高效微调方案Lora||直击底层逻辑
  • Qt for Android代码中输出日志
  • 力扣刷题-二叉树-二叉树的递归遍历
  • VX-3R APRS发射试验
  • JAVA毕业设计109—基于Java+Springboot+Vue的宿舍管理系统(源码+数据库)
  • CMU/MIT/清华/Umass提出生成式机器人智能体RoboGen
  • STM32:AHT20温湿度传感器驱动程序开发
  • 【Linux】第七站:vim的使用以及配置
  • 汇编-算术运算符
  • 线性代数 第六章 二次型
  • leetCode 213. 打家劫舍 II + 动态规划 + 从记忆化搜索到递推 + 空间优化
  • 网络编程套接字(二)
  • [极客大挑战 2019]Knife 1(两种解法)
  • 国家统计局教育部各级各类学历教育学生情况数据爬取
  • mysql、clickhouse时间日期加法
  • 21.合并两个有序链表
  • thinkphp漏洞复现
  • 暴力递归转动态规划(十三)
  • java EE 进阶
  • 记录paddlepaddle-gpu安装
  • django如何连接sqlite数据库?
  • 面试算法47:二叉树剪枝
  • 云安全-云原生k8s攻击点(8080,6443,10250未授权攻击点)
  • 性能压力测试主要目标及步骤
  • VLAN与配置
  • API接口安全设计
  • 服务器的管理口和业务口