当前位置: 首页 > news >正文

【深度学习目标检测】九、基于yolov5的路标识别(python,目标检测)

YOLOv5是目标检测领域一种非常优秀的模型,其具有以下几个优势:

1. 高精度:YOLOv5相比于其前身YOLOv4,在目标检测精度上有了显著的提升。YOLOv5使用了一系列的改进,如更深的网络结构、更多的特征层和更高分辨率的输入图像,以提升精度。

2. 高效性能:YOLOv5在目标检测任务中具有很高的处理速度和实时性。相比于其他目标检测模型,YOLOv5采用了更少的计算量和参数数量,因此它在目标检测任务中具有更快的推理速度。

3. 简单易用:YOLOv5是一个开源项目,源代码公开,并且提供了预训练的模型权重。这使得使用YOLOv5进行目标检测变得非常方便,无需从头开始训练模型,只需进行适当的微调即可。

4. 多平台适用:YOLOv5可以在多种平台上运行,包括PC端、嵌入式设备和移动设备等。这使得YOLOv5可以在各种场景下应用,如自动驾驶、智能安防、人脸识别等。

5. 多功能:YOLOv5可以检测和分类多个不同的目标类别,包括人、车辆、动物等。此外,YOLOv5还可以检测出目标的位置和大小,并提供相应的置信度。

总之,YOLOv5具有高精度、高效性能、简单易用、多平台适用和多功能等优势,使其成为目标检测领域中的一种前沿模型。

参考:【深度学习目标检测】六、基于深度学习的路标识别(python,目标检测,yolov8)

本文介绍了基于Yolov5的路标检测模型,包括训练过程和数据准备过程,同时提供了推理的代码。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。

效果如下图:

一、安装YoloV5

yolov5和yolov8的开发团队相同,安装方法一样。官方文档:主页 - Ultralytics YOLOv8 文档

安装部分参考:官方安装教程

二、数据集准备

路标检测数据集,检测4种路标:speedlimit,crosswalk,trafficlight,stop。总共877张图,其中训练集701张图、测试集176张图。

示例图片如下:

原始的数据格式为COCO格式,本文提供转换好的yolov5格式数据集,可以直接放入yolov5中训练,数据集地址(yolov5和yolov8的格式一样):路标数据集yolov5格式

三、模型训练

1、数据集配置文件

在ultralytics/ultralytics/cfg/datasets目录下添加roadsign.yaml,添加以下内容(path修改为自己的路径):

# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO 2017 dataset http://cocodataset.org by Microsoft
# Example usage: yolo train data=coco.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco  ← downloads here (20.1 GB)# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: datasets/roadsign/roadsign-yolov8  # 修改为自己的数据路径
train: images/train 
val: images/val  
test: images/val # Classes
names:# 0: normal0: speedlimit  # speedlimit,crosswalk,trafficlight,stop1: crosswalk2: trafficlight3: stop
2、修改模型配置文件

在ultralytics/ultralytics/cfg/models/v5目录下添加yolov5_roadsign.yaml,添加以下内容:

# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLOv5 object detection model with P3-P5 outputs. For details see https://docs.ultralytics.com/models/yolov5# Parameters
nc: 4  # number of classes
scales: # model compound scaling constants, i.e. 'model=yolov5n.yaml' will call yolov5.yaml with scale 'n'# [depth, width, max_channels]n: [0.33, 0.25, 1024]s: [0.33, 0.50, 1024]m: [0.67, 0.75, 1024]l: [1.00, 1.00, 1024]x: [1.33, 1.25, 1024]# YOLOv5 v6.0 backbone
backbone:# [from, number, module, args][[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2[-1, 1, Conv, [128, 3, 2]],  # 1-P2/4[-1, 3, C3, [128]],[-1, 1, Conv, [256, 3, 2]],  # 3-P3/8[-1, 6, C3, [256]],[-1, 1, Conv, [512, 3, 2]],  # 5-P4/16[-1, 9, C3, [512]],[-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32[-1, 3, C3, [1024]],[-1, 1, SPPF, [1024, 5]],  # 9]# YOLOv5 v6.0 head
head:[[-1, 1, Conv, [512, 1, 1]],[-1, 1, nn.Upsample, [None, 2, 'nearest']],[[-1, 6], 1, Concat, [1]],  # cat backbone P4[-1, 3, C3, [512, False]],  # 13[-1, 1, Conv, [256, 1, 1]],[-1, 1, nn.Upsample, [None, 2, 'nearest']],[[-1, 4], 1, Concat, [1]],  # cat backbone P3[-1, 3, C3, [256, False]],  # 17 (P3/8-small)[-1, 1, Conv, [256, 3, 2]],[[-1, 14], 1, Concat, [1]],  # cat head P4[-1, 3, C3, [512, False]],  # 20 (P4/16-medium)[-1, 1, Conv, [512, 3, 2]],[[-1, 10], 1, Concat, [1]],  # cat head P5[-1, 3, C3, [1024, False]],  # 23 (P5/32-large)[[17, 20, 23], 1, Detect, [nc]],  # Detect(P3, P4, P5)]
3、训练模型

使用如下命令训练模型,相关路径更改为自己的路径,建议绝对路径:

yolo detect train project=deploy name=yolov5_roadsign exist_ok=False optimizer=auto val=True amp=True epochs=100  imgsz=640 model=ultralytics/ultralytics/cfg/models/v5/yolov5_roadsign.yaml  data=ultralytics/ultralytics/cfg/datasets/roadsign.yaml
4、验证模型

使用如下命令验证模型,相关路径根据需要修改:

yolo detect val imgsz=640 model=deploy/yolov5_roadsign/weights/best.pt data=ultralytics/ultralytics/cfg/datasets/roadsign.yaml

精度如下图:

四、推理

训练好了模型,可以使用如下代码实现推理,将权重放到同级目录:

from PIL import Image
from ultralytics import YOLO# 加载预训练的YOLOv8n模型
model = YOLO('best.pt')# 在'bus.jpg'上运行推理
image_path = 'road423.png'
results = model(image_path)  # 结果列表# 展示结果
for r in results:im_array = r.plot()  # 绘制包含预测结果的BGR numpy数组im = Image.fromarray(im_array[..., ::-1])  # RGB PIL图像im.show()  # 显示图像im.save('results.jpg')  # 保存图像

本教程训练好的权重和推理代码、示例代码连接:推理代码和训练好的权重

http://www.lryc.cn/news/264068.html

相关文章:

  • PyCharm添加自动函数文档注释
  • 数字图像处理 基于Numpy、PyTorch在频率空间中建模运动模糊
  • 海康威视对讲广播系统 RCE漏洞复现(CVE-2023-6895)
  • 【优化】Springboot 修改 tomcat连接池
  • 百度侯震宇:AI原生与大模型将从三个层面重构云计算
  • 【SpringBoot快速入门】(2)SpringBoot的配置文件与配置方式详细讲解
  • 麒麟V10 ARM 离线生成RabbitMQ docker镜像并上传Harbor私有仓库
  • AI创作系统ChatGPT商业运营网站系统源码,支持AI绘画,GPT语音对话+DALL-E3文生图
  • 剑指offer题解合集——Week1day5
  • Redis设计与实现之数据库
  • 如何在Eclipse中安装WindowBuilder插件,详解过程
  • node.js mongoose schemaTypes
  • 论文解读:On the Integration of Self-Attention and Convolution
  • 【Spring】15 ApplicationContextAware 接口
  • Android 版本控制工具--Git
  • Wireshark高级网络安全分析
  • llvm后端之DAG设计
  • 反序列化 [SWPUCTF 2021 新生赛]ez_unserialize
  • centos(linux)安装jenkins
  • Wireshark统计和可视化
  • 高通平台开发系列讲解(SIM卡篇)SIM软件架构介绍
  • 音频筑基:瞬态、基音、偏噪信号类型分析
  • HarmonyOS ArkTS 中DatePicker先择时间 路由跳转并传值到其它页
  • Axure RP 8 for Mac/win中文版:打造完美交互式原型设计体验
  • 迪文屏开发保姆级教程——页面键盘
  • Unity的UI界面——Text/Image
  • sklearn和tensorflow的理解
  • css中BFC
  • 华为OD机试 - 小朋友来自多少小区(Java JS Python C)
  • 前端:NPM的介绍和使用