当前位置: 首页 > news >正文

YOLO快速入门

Yolo简介

概述

YOLO(You Only Look Once)是一种流行的目标检测算法,由Joseph Redmon等人开发。
YOLO算法以其高效的实时性能和准确的检测能力而闻名。自YOLO的首次提出以来,已经经
历了多个版本的更新和改进。以下是YOLO发展史的简要概述:

YOLOv1(2015)
YOLOv1是YOLO系列的开山之作,它将目标检测问题视为一个回归问题,通过一个神经网络
直接在输入图像上进行预测,而不需要使用滑动窗口或区域提议的方法。它将图像划分为SxS的网格,每个网格单元负责预测中心点落在该单元内的物体的边界框和类别概率。YOLOv1在速度和准确
性之间取得了很好的平衡,尤其是在实时目标检测任务中。

YOLOv2 (也称YOLO9000)2016
YOLOv2在YOLOv1的基础上进行了改进,提高了检测速度和准确性。引入了批量归一化(Batch
Normalization)和锚框(Anchor Boxes)的概念,以更好地处理不同尺寸的物体。YOLO9000能
够检测多达9000个类别,通过结合ImageNet和COCO数据集进行训练。

YOLOv3(2018)
YOLOv3进一步优化了网络结构,提高了检测精度,尤其是在小物体和复杂场景中。引入了多尺度
预测和新的损失函数,如IoU损失,以改善模型性能。YOLOv3在COCO数据集上取得了显著的性
能提升。

YOLOv4(2020)
YOLOv4由Alexey Bochkovskiy等人开发,旨在实现最佳的速度和准确性。引入了多种新技术,
如加权残差连接(WRC)、跨阶段部分连接(CSP)、跨小批量标准化(CmBN)等,以提高
模型的效率和性能。YOLOv4在保持高速的同时,提供了与两阶段检测器相媲美的准确性。

YOLOv5(2020)
YOLOv5并非由原始YOLO作者团队发布,而是由其他研究者基于YOLOv4进行的改进。YOLOv5
在网络结构和训练策略上进行了优化,以提高检测速度和准确性。它提供了多种大小的模型,以
适应不同的计算资源和应用场景。

YOLOv6 (2021)
YOLOv6 是由美团视觉智能部研发的目标检测框架,基于YOLOv5,YOLOv6继续在速度和准确性
上进行优化。引入了新的特征金字塔网络(FPN)和注意力机制,以提高对小物体的检测能力。

YOLOv7(2021)
YOLOv7是YOLO系列的最新版本,它在YOLOv6的基础上进一步改进。
通过引入新的网络架构和训练技巧,YOLOv7在保持高速的同时,提高了检测的准确性。

YOLOv8 (2023)
YOLOv8 的具体创新包括一个新的骨干网络、一个新的 Ancher-Free(无锚点)检测头和一个新的损失函数。YOLOv8 可以在从 CPU 到 GPU 的各种硬件平台上运行,提供了一个全新的 SOTA(State of the Art,最先进)模型。YOLOv8 也支持全方位的视觉 AI 任务,包括检测、分割、姿态估计、跟踪和分类。

Miniconda安装

下载地址

https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-py38_22.11.1-1-Windows-x86_64.exe

pytorch安装

下载Yolo代码&安装依赖

推理demo图片

推理视频

导出模型

自定义数据集

安装labelme&使用方法

转换数据集

labelme2yolo
目标检测训练
目标检测推理
目标分割训练
目标检测推理
结语

http://www.lryc.cn/news/311539.html

相关文章:

  • 基于 LLaMA 和 LangChain 实践本地 AI 知识库
  • GraphGeo参文2:Fourth-Order Runge–Kutta(四阶RK方法)
  • 解密Lawnchair:打造个性化极致的Android桌面体验
  • c语言-函数-009
  • Spring事件发布监听器ApplicationListener原理- 观察者模式
  • 系统学习Python——装饰器:直接管理函数和类
  • Leetcode 3049. Earliest Second to Mark Indices II
  • CrossOver 24下载-CrossOver 24 for Mac下载 v24.0.0中文永久版
  • 算法设计.
  • 20240304金融读报:票据贴现数据挖掘与新质生产力信贷创新
  • 05. Nginx入门-Nginx访问控制
  • S2---FPGA-A7板级原理图硬件实战
  • RK DVP NVP6158配置 学习
  • C++基础2:C++基本数据类型和控制结构
  • HFSS仿真双频微带天线学习笔记
  • 【十一】【SQL】外连接(左外连接,右外连接)
  • 敏捷开发模型:一种灵活、协作和持续的软件开发方法
  • 软件设计师10--计算机组成与体系结构章节回顾
  • 数据库分库分表中间件选择
  • 代码随想录算法训练营第22天|235.二叉搜索树的最近公共祖先、701.二叉搜索树中的插入操作、450.删除二叉搜索树中的节点
  • 基于SpringBoot的医护人员排班系统详细开题报告(源码)
  • CDH6.3.1离线安装
  • Pytorch之卷积操作
  • 2024年春招小红书前端实习面试题分享
  • 软件测试--性能测试工具JMeter
  • c++/c图的邻近矩阵表示
  • cocos-lua定时器用法
  • 激活函数Swish(ICLR 2018)
  • 【C++ 标准流,文件流】
  • 【排序】详解冒泡排序