当前位置: 首页 > news >正文

【CV 目标检测】Fast RCNN模型③——模型训练/预测

(2)模型训练

R-CNN中的特征提取和检测部分是分开进行的,Fast R-CNN提出一个高效的训练办法:多任务训练
Fast R-CNN有两种输出:

  1. 一部分输出在K+1个类别上的离散概率分布(每个候选区域),p=(p0,p1,…,pk)p = (p_0,p_1,\dots,p_k)p=(p0,p1,,pk)。通常,通过全连接层的K+1个输出上的Softmax来计算概率值
  2. 另一部分输出对于由K个类别中的每一个检测框回归偏移,tk=(txk,tyk,twk,thk)t^k = (t_x^k, t_y^k, t_w^k, t_h^k)tk=(txk,tyk,twk,thk)。其中tkt_ktk指定相对于候选框的尺寸不变转换和对数空间高度/宽度位移,与在RPN网络中是一样的
    将上面两个任务的损失函数放在一起:
    L(p,u,tu,v)=Lcls(p,u)+λ[u≥1]LIoc(tu,v)L(p, u,t^u, v) = L_{cls}(p,u)+\lambda[u \ge 1]L_{Ioc(t^u,v)}L(p,u,tu,v)=Lcls(p,u)+λ[u1]LIoc(tu,v)联合训练fast-RCNN网络。
    ppp:网络预测分类结果
    uuu:每个候选区有一个目标值,即uuu为类别的真实值
    tut^utu:每个候选框对应的框的真实值
    vvv:网络预测出来的结果
    u≥1u\ge1u1:只用类别不是背景的,才会计算回归损失

(3)模型预测

● 输入图像

● 图像被送入到卷积网络进行特征提取,将通过选择性搜索获取的候选区域映射到特征图中

● 在特征图上Rol中应用RolPooling,获取尺寸相同的特征向量

● 将这些区域传递到全连接的网络中进行分类和回归,得到目标检测的结果

(4)模型总结

Fast R-CNN是对R-CNN模型的一种改进:

  1. CNN网络不再是对每个候选区域进行特征提取,而是直接对整张图像进行出路,这样减少了很多重复计算
  2. 用ROI Pooling进行特征的尺寸变换,来满足FC全连接层对输入数据尺度的要求
  3. 将目标的回归和分类统一在一个网络中,使用FC+softmax进行目标分类,使用FC layer进行目标框的回归
    在Fast R-CNN中使用的目标检测识别网络,在速度和精度上都有了不错的结果。但是,其候选区域提取方法耗时较长,而且和目标检测网络是分离的,并不是端到端的。因此,在2016年又提出了Faster R-CNN模型用于目标检测
http://www.lryc.cn/news/624742.html

相关文章:

  • 短剧小程序系统开发:推动短剧行业规范化与标准化发展
  • 移动端PFD预览组件Vue3(非插件)
  • Nacos-6--Naco的QUIC协议实现高可用的工作原理
  • Linux系统启动原理及故障排除
  • GitHub Actions 从核心思想到最佳实践
  • Go语言基础结构全解析
  • 海洋牧场:奏响乡村振兴的蓝色乐章
  • Mysql——前模糊索引失效原因及解决方式
  • Linux软件编程(七)线程间同步与进程间通信
  • Tomcat Wrapper源码解析:深入理解Servlet生命周期与请求分发机制
  • 【81页PPT】国内某知名大型制药企业制药数字化转型项目汇报方案(附下载方式)
  • Leetcode 3650. Minimum Cost Path with Edge Reversals
  • Linux学习:实现简单的共享内存通信
  • 06多段代码复杂度合成规则
  • 学习日志37 python
  • [优选算法专题二滑动窗口——水果成篮]
  • PyTorch数据处理工具箱(数据处理工具箱概述)
  • 【JavaEE】(16) Spring Boot 日志
  • C语言关于函数传参和返回值的一些想法
  • 《亚矩阵云手机重构出租接单:KVM 虚拟化与边缘计算驱动的设备替代技术路径》
  • Highcharts for Flutter 正式发布
  • SQL语法大全指南
  • 【Day 29 】Linux-数据库
  • 设计模式(四)——责任链模式
  • 福彩双色球第2025095期篮球号码分析
  • 19.8 《3步实现OPT-6.7B无损量化:用自定义数据集省70%显存,精度仅跌2.3%》
  • 终极方案!lightRag/graphRag离线使用tiktoken持续报错SSLError,不改源码,彻底解决!
  • 海洋牧场邂逅海洋旅游:碰撞出新业态的璀璨火花
  • 北斗安心联车辆管理系统优势分析
  • 飞机起落架轮轴深孔中间段电解扩孔内轮廓检测 - 激光频率梳 3D 轮廓检测