当前位置: 首页 > news >正文

YOLO简史

【欢迎关注编码小哥,学习更多实用的编程方法和技巧】

YOLO历史

YOLO (You Only Look Once) 是一种流行的对象检测和图像分割模型,由华盛顿大学的 Joseph Redmon 和 Ali Farhadi 开发。YOLO 于 2015 年推出,因其高速和准确性而迅速受到欢迎。

YOLOv2 于 2016 年发布,通过合并批量规范化、锚框和维度集群改进了原始模型。

YOLOv3 于 2018 年推出,使用更高效的主干网络、多个锚点和空间金字塔池进一步增强了模型的性能。

YOLOv4 于 2020 年发布,引入了 Mosaic 数据增强、新的无锚点检测头和新的损失函数等创新。

YOLOv5 进一步提高了模型的性能,并添加了新功能,例如超参数优化、集成实验跟踪和自动导出为流行的导出格式。

YOLOv6 由美团于 2022 年开源,并被用于该公司的许多自主送货机器人。

YOLOv7 添加了其他任务,例如对 COCO 关键点数据集进行姿态估计。

YOLOv8 由 Ultralytics 于 2023 年发布。YOLOv8 引入了新功能和改进,以增强性能、灵活性和效率,支持全方位的视觉 AI 任务。

YOLOv9 引入了可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN) 等创新方法。

YOLOv10 由清华大学的研究人员使用 Ultralytics Python 包创建。此版本通过引入端到端头来提供实时对象检测改进,消除了非最大抑制 (NMS) 要求。

YOLO11 新功能:Ultralytics 的最新 YOLO 模型在多项任务(包括检测、分割、姿态估计、跟踪和分类)中提供最先进的 (SOTA) 性能,利用了各种 AI 应用程序和领域的功能。

常见问题

什么是 Ultralytics YOLO,它如何改进对象检测?

Ultralytics YOLO 是广受赞誉的 YOLO (You Only Look Once) 系列的最新进展,用于实时对象检测和图像分割。它基于以前的版本构建,引入了新功能和改进,以提高性能、灵活性和效率。YOLO 支持各种视觉 AI 任务,例如检测、分割、姿势估计、跟踪和分类。其最先进的架构确保了卓越的速度和准确性,使其适用于各种应用程序,包括边缘设备和云 API。

如何开始 YOLO 安装和设置?

YOLO 的入门既快速又简单。你可以使用 pip 安装 Ultralytics 软件包,并在几分钟内启动并运行。下面是一个基本的安装命令:

pip install ultralytics

如何在我的数据集上训练自定义 YOLO 模型?

在数据集上训练自定义 YOLO 模型涉及几个详细步骤:

准备带注释的数据集。

在 YAML 文件中配置训练参数。

使用 yolo TASK train 命令开始训练。(每个 TASK 都有自己的参数)

以下是对象检测任务的示例代码:

from ultralytics import YOLO# Load a pre-trained YOLO model (you can choose n, s, m, l, or x versions)model = YOLO("yolo11n.pt")# Start training on your custom datasetmodel.train(data="path/to/dataset.yaml", epochs=100, imgsz=640)

Ultralytics YOLO 有哪些可用的许可选项?

Ultralytics 为 YOLO 提供两种许可选项:

AGPL-3.0 许可证:此开源许可证非常适合教育和非商业用途,促进开放式协作。

企业许可证:专为商业应用程序而设计,允许将 Ultralytics 软件无缝集成到商业产品中,而不受 AGPL-3.0 许可证的限制。

如何使用 Ultralytics YOLO 进行实时对象跟踪?

Ultralytics YOLO 支持高效且可定制的多对象跟踪。要使用跟踪功能,您可以使用 yolo track 命令,如下所示:

from ultralytics import YOLO#加载预训练模型model = YOLO("yolo11n.pt")#开始追踪视频中的物体,可以使用直播流或者摄像头输入model.track(source="path/to/video.mp4")

http://www.lryc.cn/news/503804.html

相关文章:

  • 低通滤波器,高通滤波器,公式
  • 深入了解IPv6——光猫相关设定:DNS来源、DHCPv6服务、前缀来源等
  • 前端国际化实战:从需求到落地的完整实践
  • React的状态管理库-Redux
  • 【Android学习】RxJava
  • Pycharm访问MySQL数据库·上
  • 【CUDA】CUBLAS
  • YOLOv8-ultralytics-8.2.103部分代码阅读笔记-predict.py
  • 细说Flash存储芯片W25Q128FW和W25Q16BV
  • python爬虫--小白篇【爬取B站视频】
  • Three.js入门-模型加载
  • ECharts实现数据可视化入门详解
  • C++(举例说明类的实例化方式)
  • LeetCode32. 最长有效括号(2024冬季每日一题 32)
  • Textfocals ——基于大言模型的用户驱动型文本改进工具让用户在审阅自己的写作时对其进行修改
  • docker 部署 redis
  • 微信小程序横屏页面跳转后,自定义navbar样式跑了?
  • 回归预测 | MATLAB实现BiGRU(双向门控循环单元)多输入单输出
  • 智能时代的基石:神经网络
  • 红与黑,,
  • 嵌入式驱动开发详解16(音频驱动开发)
  • 【嵌入式软件】跑开发板的前置服务配置
  • 如何高效实现进程间通信
  • scala基础学习_变量
  • Java 身份证校验工具类(15位校验、18位校验与15转18)
  • HTML+CSS+Vue3的静态网页,免费开源,可当作作业使用
  • 【FAQ】HarmonyOS SDK 闭源开放能力 —Push Kit(8)
  • HCIA-Access V2.5_2_2_2网络通信基础_IP编址与路由
  • 音频客观测评方法PESQ
  • 前后端分离的项目使用nginx 解决 Invalid CORS request