当前位置: 首页 > news >正文

深度学习经典检测方法概述

一、深度学习经典检测方法

two-stage(两阶段):Faster-rcnn Mask-Rcnn系列
one-stage(单阶段):YOLO系列
在这里插入图片描述
1. one-stage

最核心的优势:速度非常快,适合做实时检测任务!
但是缺点也是有的,效果通常情况下不会太好!

在这里插入图片描述

2. two-stage

速度通常较慢(5FPS),但是效果通常还是不错的!
非常实用的通用框架MaskRcnn

在这里插入图片描述

二、指标分析

1. IOU:交集(真实值和预测值)/并集
在这里插入图片描述
2. P-R图
精度和召回率计算
在这里插入图片描述在这里插入图片描述

精度是指模型正确预测为正例的样本数量与所有被模型预测为正例的样本数量的比率。换句话说,精度衡量了模型的预测中有多少是真正的正例。

召回率是指模型正确预测为正例的样本数量与所有实际正例的样本数量的比率。召回率衡量了模型能够正确识别多少真正的正例。

3. map指标:综合衡量检测效果;
在这里插入图片描述
举个例子。设定第一张图的预测框叫pre1,第一张的真实框叫label1。第二张、第三张同理。
在这里插入图片描述

(1)根据IOU计算TP,FP

首先我们计算每张图的pre和label的IOU,根据IOU是否大于0.5来判断该pre是属于TP还是属于FP。显而易见,pre1是TP,pre2是FP,pre3是TP。

(2)置信度排序

根据每个pre的置信度进行从高到低排序,这里pre1、pre2、pre3置信度刚好就是从高到低。

(3)在不同置信度阈值下获得Precision和Recall

  • 首先,设置阈值为0.9,无视所有小于0.9的pre。那么检测器检出的所有框pre即TP+FP=1,并且pre1是TP,那么Precision=1/1。因为所有的label=3,所以Recall=1/3。这样就得到一组P、R值。
  • 然后,设置阈值为0.8,无视所有小于0.8的pre。那么检测器检出的所有框pre即TP+FP=2,因为pre1是TP,pre2是FP,那么Precision=1/2=0.5。因为所有的label=3,所以Recall=1/3=0.33。这样就又得到一组P、R值。
  • 再然后,设置阈值为0.7,无视所有小于0.7的pre。那么检测器检出的所有框pre即TP+FP=3,因为pre1是TP,pre2是FP,pre3是TP,那么Precision=2/3=0.67。因为所有的label=3,所以Recall=2/3=0.67。这样就又得到一组P、R值。

(4)绘制PR曲线并计算AP值

根据上面3组PR值绘制PR曲线如下。然后每个“峰值点”往左画一条线段直到与上一个峰值点的垂直线相交。这样画出来的红色线段与坐标轴围起来的面积就是AP值。

在这里插入图片描述
(5)计算mAP

AP衡量的是对一个类检测好坏,mAP就是对多个类的检测好坏。就是简单粗暴的把所有类的AP值取平均就好了。比如有两类,类A的AP值是0.5,类B的AP值是0.2,那么mAP=(0.5+0.2)/2=0.35

mAP值越大表明,该目标检测模型在给定的数据集上的检测效果越好。

http://www.lryc.cn/news/389920.html

相关文章:

  • <sa8650>sa8650 qcxserver-之-摄像头传感器VB56G4A驱动开发<1>
  • 推荐8款超实用的ComfyUI绘画插件,帮助我们的AI绘画质量和效率提升几个档次!
  • MATLAB-振动问题:两自由度耦合系统自由振动
  • 人工智能-NLP简单知识汇总01
  • Spring Boot中的异步编程技巧
  • 深度解密Spark性能优化之道
  • 在U盘/移动硬盘上安装热插拔式Ubuntu系统,并将Docker目录挂载到NTFS硬盘
  • 商城小程序论文(设计)开题报告
  • 15. Java的 CAS 操作原理
  • 修改element-ui日期下拉框datetimePicker的背景色样式
  • Linux—— 逻辑运算符,压缩和解压缩
  • 音视频入门基础:H.264专题(6)——FFmpeg源码:从H.264码流中提取NALU Header、EBSP、RBSP和SODB
  • STM32实现按键单击、双击、长按、连按功能,使用状态机,无延时,不阻塞
  • C#之Delta并联机械手的视觉同步分拣
  • 01:Linux的基本命令
  • GNSS 载波、测距码和导航电文的关系简介
  • deepE 定位系统卡顿问题实战(一) ----------- 锁造成的阻塞问题
  • YOLOv5改进 | 主干网络 | ODConv + ConvNeXt 增强目标特征提取能力
  • TIA博途WinCC通过VB脚本从 Excel中读取数据的具体方法介绍
  • 第5篇 区块链的技术架构:节点、网络和数据结构
  • vue长列表,虚拟滚动
  • 【实战场景】记一次UAT jvm故障排查经历
  • 线性代数--行列式1
  • tensorflow神经网络
  • Python基础001
  • 【udp报文】udp报文未自动分片,报文过长被拦截问题定位
  • 某网页gpt的JS逆向
  • 【python脚本】批量检测sql延时注入
  • 在C++中如何理解const关键字的不同用法(如const变量、const成员函数、const对象等)
  • JavaSEJava8 时间日期API + 使用心得