当前位置: 首页 > news >正文

【YOLO学习】YOLOv5口罩检测实战

文章目录

  • 1. 环境配置
  • 2. 下载代码
  • 3. 安装库
    • 3.1 安装pytorch
    • 3.2 安装其他库
  • 4. 测试
  • 5. 数据标注
  • 6. 模型训练
  • 7. 界面可视化


1. 环境配置

 1. 先参考其他文章安装 Anaconda 或者 Miniconda,我安装的是 Miniconda。

 2. 更换国内源,以加快速度 。可以参考下面这个博客:https://blog.csdn.net/hanjmm/article/details/127433373

 3. 打开 Anaconda Prompt,创建环境:

conda create -n mask python==3.8conda activate mask

2. 下载代码

 1. 下载代码,代码网址:https://gitee.com/song-laogou/yolov5-mask-42

 2. 我学到了一点:可以直接在这个目录导航输入 cmd,进入的终端直接 cd 到这个文件路径下。
 如图:在这个终端下激活 mask 虚拟环境。

在这里插入图片描述

在这里插入图片描述

3. 安装库

3.1 安装pytorch

 1. 如果你的电脑没有 GPU,只有 CPU 的话,运行下面指令,耐心等上几分钟。

conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cpuonly -c pytorch # 可以修改pytorch版本

 2. 如果你的电脑有 GPU,可以安装 GPU 版本的 pytorch,操作如下内容所示。

 3. win+R 进入命令行输入 nvidia-smi,可以查看 CUDA 版本。

vid

 4. 从官网下载对应的 CUDA 版本,由于我的显卡版本为 12.5,我只需要安装小于或者等于 12.5 都是可以的,因此这里我安装12.0。下图中的 Version 是指的是 win10 还是 win11。
 官网地址:CUDA Toolkit Archive | NVIDIA Developer

在这里插入图片描述

在这里插入图片描述

 5. 之后安装 Cudaa 和 Pytorch。这里安装步骤可以参考一下网上一些教程,这里我就不再说了。

3.2 安装其他库

pip install pycocotools-windows
pip install -r requirements.txt
pip install pyqt5
pip install labelme

4. 测试

 1. 在命令行输入指令:

python detect.py --source data/images/bus.jpg --weights pretrained/yolov5s.pt

 2. 在runs目录下可以找到检测之后的结果,环境安装完成!

在这里插入图片描述

在这里插入图片描述

5. 数据标注

 1. 在环境中运行指令:pip install labelimg,再运行:labelimg 即可打开。

在这里插入图片描述

 2. 软件启动后的界面如下所示。一般刚开始我们要选择打开需要标注的图片路径和标注文件保存的位置,并把标注的格式改为 yolo。

在这里插入图片描述

 3. 标注完成之后你会得到一系列的 txt 文件,这里的 txt 文件就是目标检测的标注文件,其中 txt文件和图片文件的名称是一一对应的,如下图所示:

在这里插入图片描述

在这里插入图片描述

 4. 打开具体的标注文件,你将会看到下面的内容,txt 文件中每一行表示一个目标,以空格进行区分,分别表示目标的类别 id,归一化处理之后的中心点 x 坐标、y 坐标、目标框的 w 和 h。

在这里插入图片描述

6. 模型训练

 1. 可以下载别人标注好的数据集进行训练,比如这里的数据集:https://download.csdn.net/download/ECHOSON/63290559
 标记完成的数据请按照下面的格式进行放置,方便程序进行索引。

YOLO_Mask # 存放数据集文件名称
└─ score├─ images│    ├─ test # 下面放测试集图片│    ├─ train # 下面放训练集图片│    └─ val # 下面放验证集图片└─ labels├─ test # 下面放测试集标签├─ train # 下面放训练集标签├─ val # 下面放验证集标签

 2. 修改配置:

在这里插入图片描述

 (1)修改 data 里面的数据集配置文件:

在这里插入图片描述

 (2)修改 model 里面的模型配置文件:

在这里插入图片描述

 (3)在 train.py 里面已经放好了示例命令:

在这里插入图片描述

7. 界面可视化

 可视化界面的部分在 window.py 文件中,是通过 pyqt5 完成的界面设计,在启动界面前,你需要将模型替换成你训练好的模型,替换的位置在 window.py 的第 60 行,修改成你的模型地址即可,如果你有 GPU 的话,可以将 device 设置为 0,表示使用第 0 行 GPU,这样可以加快模型的识别速度。

在这里插入图片描述

http://www.lryc.cn/news/453440.html

相关文章:

  • 场景题1-设计redis的key和value的原则
  • Shell-使用函数
  • Git介绍--github/gitee/gitlab使用
  • 【ubuntu】【VirtualBox】VirtualBox无法加载USB移动设备的解决方法(支持U盘启动盘)
  • Koa2+mongodb项目实战1(项目搭建)
  • Pyhton爬虫使用Selenium实现浏览器自动化操作抓取网页
  • 矩阵学习过程中的一些思考
  • 初识Django
  • VirtualBox虚拟机连接宿主机并能够上网(小白向)
  • 深度学习每周学习总结J1(ResNet-50算法实战与解析 - 鸟类识别)
  • 商家营销工具架构升级总结
  • 移动硬盘无法读取:问题解析与高效数据恢复实战
  • 20241005给荣品RD-RK3588-AHD开发板刷Rockchip原厂的Android12时使用iperf3测网速
  • node配置swagger
  • MATLAB plot画线的颜色 形状
  • Goland使用SSH远程Linux进行断点调试 (兼容私有库)
  • LLM | Ollama WebUI 安装使用(pip 版)
  • Three.js基础内容(一)
  • 网站建设制作需要注意
  • 【Python】Uvicorn:Python 异步 ASGI 服务器详解
  • 类型转换【C++提升】(隐式转换、显式转换、自定义转换、转换构造函数、转换运算符重载......你想知道的全都有)
  • 微信小程序hbuilderx+uniapp+Android 新农村综合风貌旅游展示平台
  • 【AI大模型】使用Embedding API
  • 面试速通宝典——11
  • python:reportlab 将多个图片合并成一个PDF文件
  • 决策树:机器学习中的强大工具
  • 平面电磁波(解麦克斯韦方程)电场相位是复数的积分常数,电场矢量每个分量都有一个相位。磁场相位和电场一样,这是因为无损介质中实数的波阻抗
  • 复习HTML(进阶)
  • Qt 每日面试题 -7
  • 《计算机原理与系统结构》学习系列——计算机的算数运算(下)