当前位置：首页 > news >正文

（论文阅读11/100）Fast R-CNN

news 2025/8/18 0:59:35

文献阅读笔记
简介	题目	Fast R-CNN
	作者	Ross Girshick
	原文链接	https://arxiv.org/pdf/1504.08083.pdf 目标检测系列——开山之作RCNN原理详解-CSDN博客 Fast R-CNN讲解_fast rcnn-CSDN博客 Rcnn、FastRcnn、FasterRcnn理论合集_rcnn fastrcnn fasterrcnn_沫念·的博客-CSDN博客
	关键词	NUll
	研究问题	目标检测任务背景：首先确定大量候选对象位置；其次对候选对象细化以确定目标位置。这些问题的解决往往折中了速度、精度或者简单性。之前的方法： RCNN提取2000个候选框冗余工作太多。 SPP算法也有缺点：仅使用log损失函数微调无法更新空间金字塔池化前的卷积层，限制了非常深的网络的准确性。
	研究方法	Fast R - CNN：用全连接层分类。 ROI pooling：感兴趣区域池化。使用最大池化将任何有效感兴趣区域内的特征转换为具有固定空间范围H × W (例如, 7 × 7)的小特征映射，其中H和W是独立于任何特定RoI的层超参数。每个RoI由一个四元组特征(r,c,h,w)定义，该(r,c,h,w)指定其左上角(r,c)及其高度和宽度(h,w)。是SSp的特例，其中只有一个金字塔层。从预训练的网络中初始化：将最后一个最大池化层替换为RoI池化层，通过设置H和W与网络的第一个全连接层(例如,对于VGG16 , H = W = 7)兼容来配置RoI池化层。其次，将网络的最后一个全连接层和softmax (分别训练用于1000 - way ImageNet分类)替换为前面描述的两个兄弟层( K + 1个类别上的全连接层和softmax以及类别特定的边界框回归)。第三，修改网络以获取两个数据输入：图像列表和这些图像中的RoIs列表。 Multi-task loss. Mini-batch sampling.
	研究结论	1.比R - CNN、SPPnet拥有更高的检测质量 2.训练是单阶段的，使用多任务损失3.训练可以更新所有的网络层4.特征缓存不需要磁盘存储
	创新不足	候选区域的选择仍然不是很高效
	额外知识	RCNN网络

http://www.lryc.cn/news/218155.html

相关文章：

Git 标签（Tag）实战：打标签和删除标签的步骤指南

React 底层 Fiber 架构简单理解

使用 Python 进行自然语言处理第 4 部分：文本表示

【LLM】大语言模型高效微调方案Lora||直击底层逻辑

Qt for Android代码中输出日志

力扣刷题-二叉树-二叉树的递归遍历

VX-3R APRS发射试验

JAVA毕业设计109—基于Java+Springboot+Vue的宿舍管理系统(源码+数据库)

CMU/MIT/清华/Umass提出生成式机器人智能体RoboGen

STM32:AHT20温湿度传感器驱动程序开发

【Linux】第七站：vim的使用以及配置

汇编-算术运算符

线性代数第六章二次型

leetCode 213. 打家劫舍 II + 动态规划 + 从记忆化搜索到递推 + 空间优化

网络编程套接字（二）

[极客大挑战 2019]Knife 1（两种解法）

国家统计局教育部各级各类学历教育学生情况数据爬取

mysql、clickhouse时间日期加法

21.合并两个有序链表

thinkphp漏洞复现

暴力递归转动态规划（十三）

记录paddlepaddle-gpu安装

django如何连接sqlite数据库？

面试算法47：二叉树剪枝

云安全-云原生k8s攻击点（8080，6443，10250未授权攻击点）

性能压力测试主要目标及步骤

API接口安全设计

服务器的管理口和业务口