当前位置: 首页 > news >正文

《深度学习》 了解YOLO基本知识

目录

一、关于YOLO

1、什么是YOLO

2、经典的检测方法

1)one-stage单阶段检测

模型指标介绍:

2)two-stage多阶段检测

二、关于mAP指标

1、概念

2、IOU

3、关于召回率和准确率

4、示例

5、计算mAP


一、关于YOLO

1、什么是YOLO

        YOLO(You Only Look Once)是一种基于深度学习的目标检测算法,由Joseph Redmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题,通过一个神经网络直接预测目标的类别位置,例如下图所示。

        YOLO算法将输入图像分成SxS个网格,每个网格负责预测该网格内是否存在目标以及目标的类别和位置信息。此外,YOLO算法还采用了多尺度特征融合的技术,使得算法能够在不同尺度下对目标进行检测。

        关于不同尺度:例如在ResNet残差网络中,无论是18层的还是36层的,他们的输入图像的尺寸都是固定不变的,不能传入不同尺寸的图像,而YOLO算法可以传入任意大小的图片,对其进行检测。

        相比于传统的目标检测算法,如R-CNN、Fast R-CNN和Faster R-CNN等,YOLO算法具有更快的检测速度和更高的准确率,这得益于其端到端训练方式单阶段检测的特性,使其可以同时处理分类定位任务,避免了传统方法中的多阶段处理过程。因此,YOLO算法广泛应用于实时目标检测自动驾驶等领域。

        关于端到端:

                端到端的训练是模型直接从原始输入数据学习如何映射到最终的输出目标,而不需要在中间阶段进行人为的特征工程或分割成多个独立的处理模块。例如,以前的汽车自动驾驶,通过车上搭载的摄像头拍摄实时画面,将获取到的画面每一帧图像传入模型进行识别,然后对模型的输出结果进行判断,判断是哪种类别,是否需要减速转向,然后再执行相应的减速转弯等操作,二当前端到端的训练,摄像头的事实画面帧传入模型后,经过检测后直接执行减速转向灯的操作。

2、经典的检测方法

1)one-stage单阶段检测

        YOLO系列、SSD

        单阶段检测指在目标检测任务中,通过一个网络模型直接预测出物体的类别和位置。

        优点:识别速度非常快,适合做实时检测任务

        缺点:正确率相对two-stage较低,尤其在小物体和严重遮挡的情况下性能较差。

        模型指标介绍:

        mAP指标:用于评判目标检测效果,其值越大越好,在机器学习的分类任务  

        FLOPS:表示模型进行一次前向传播(即处理一张图像)所需要的浮点运算次数。它是一个衡量算法效率的关键指标,与模型的计算量和推断速度密切相关。

        FPS:每秒可以处理的图像数量

2)two-stage多阶段检测

        Faster-rcnn和mask-Rcnn系列

        两阶段目标检测器是一种先生成候选框,然后对候选框进行分类和回归的检测方法。这种方法主要包括两个阶段:

        第一阶段:生成候选框。这通常通过一个类似于Selective Search或EdgeBoxes等区域提名算法来实现,该算法从输入图像中生成多个候选框。每个候选框都会经过一个CNN模型进行特征提取,然后通过分类器进行过滤,保留与目标物体更相似的候选框。

         第二阶段:在保留的候选框上进行精细的分类和回归。这个阶段通常使用另一个CNN模型或类似SVM的分类器来进行分类和回归。对于每个候选框,可能需要预测物体的类别、位置和大小等。 代表性的两阶段目标检测器包括R-CNN系列,以及其改进版本Fast R-CNN、Faster R-CNN和Mask R-CNN等。

        优点:正确率比较高,识别效果理想

        缺点:识别速度比较慢,通常达到5FPS

二、关于mAP指标

1、概念

        mAP(mean Average Precision)是用来评估目标检测算法性能的常用指标之一。它结合了目标检测算法的准确率和召回率,并考虑了不同类别之间的差异。

        准确率是指预测为该类别的样本中,被正确分类的比例。召回率是指该类别中被正确分类的样本数与该类别总样本数的比例。

2、IOU

        IOU用于评估预测框真实目标框之间的重叠程度,即计算预测框和真实目标框的交集面积除以它们的并集面积来进行计算。

3、关于召回率和准确率

        1、召回率:预测的结果是真的有多少是预测正确的

        2、准确率:真实的结果中有多少是预测正确的

4、示例

        如上图所示,蓝色框中为真实的人脸,红色框为预测的人脸位置,旁边的值则表示为置信度的值也叫阈值,表示模型对于预测结果的置信程度,即模型认为该结果是正确的程度。

        计算这个检测任务中精确率召回率:

               1、限制阈值,例如0.9,超过0.9表示检测正确1,否则检测失败,此时真实值1预测值为1的只有1个,真实值为1预测值为0的为2,真实值为0预测值为1的0个,真实值为0预测值为0的有0个。

               2、统计TP、FP、FN,TP=1,FP=0,FN=2,精确率=1/1,召回率=1/(1+2)=1/3

5、计算mAP

        根据不同的阈值(置信度),绘制出召回率精确率的曲线,将曲线以下的面积作为MAP值。当MAP值越大,则表示指标越好 。

http://www.lryc.cn/news/470475.html

相关文章:

  • 什么是Kubernetes?K8s基础与工作原理
  • HTML5新增属性
  • 软件开发术语(E开头)---持续更新
  • 多机器人编队避障算法(1)
  • 【网站项目】SpringBoot401超市收银系统
  • KD树详解:多维数据高效搜索的利器
  • 从裸机到70B大模型2:基础设施设置与脚本
  • shodan4,挂黑网站查找,弱口令网站搜索
  • spring boot 整合Knife4j
  • 攻防世界的新手web题解
  • 【国潮来袭】华为原生鸿蒙 HarmonyOS NEXT(5.0)正式发布:鸿蒙诞生以来最大升级,碰一碰、小艺圈选重磅上线
  • pytest 单元框架里,前置条件
  • 数字IC后端实现 | Innovus各个阶段常用命令汇总
  • MySQL全文索引检索中文
  • pikachu靶场-Cross-Site Scripting(XSS)
  • 在数据库访问中,使用localhost、127.0.0.1和IP地址有什么差异
  • C语言 | Leetcode C语言题解之第513题找树左下角的值
  • 人工智能:改变未来生活与工作的无尽可能
  • 讲一讲 kafka 的 ack 的三种机制?
  • 若依框架部署到服务器后头像资源访问404
  • 纯GO语言开发RTSP流媒体服务器-RTSP推流直播、本地保存录像、录像回放、http-flv及hls协议分发
  • el-table相关的功能实现
  • 衡石分析平台系统分析人员手册-展示类控件创建富文本攻略
  • 为什么在网络中不能直接传输数据
  • javascript实现aes算法(支持微信小程序)
  • Centos系统新增网卡后获取不到网卡的IP地址解决方法
  • U-net医学分割网络——学习笔记
  • CIM+全场景应用,铸就智慧城市发展新篇
  • ts:对象数组的简单使用
  • 当我们在微服务中使用API网关时,它是否会成为系统的瓶颈?这种潜在的瓶颈如何评估和解决?如何在微服务架构中保证高效请求流量?|API网关|微服务|异步处理