当前位置: 首页 > news >正文

在pycharm中配置GPU训练环境(Anaconda)(yolov5)

目录

1. 具体的配置过程:

2. 在指定位置(路径)创建虚拟环境:

3. conda常用命令:

4: 在跑模型时候遇到的一些问题:

        4.1: conda添加python解释器找不到对应的python.exe文件

        4.2: 报错“OSError: [WinError 1455] 页面文件太小,无法完成操作。”

        4.3: 报错“CUDA out of memory. Tried to allocate 14.00 MiB

                  5: CUDA11.1版本出现NAN的问题原因及解决措施: 

                  6: 虚拟环境中的cuda和系统中cuda的区别:

                  7: 对于动漫角色,训练效果不是很好 :


1. 具体的配置过程:

手把手教你Anaconda安装虚拟环境配置yolov5

2. 在指定位置(路径)创建虚拟环境:

1:使用命令查看当前拥有的虚拟环境

conda info --envs

在这里插入图片描述
2:在指定目录下创建新的虚拟环境,输入命令:

conda create --prefix=C:/ProgramData/Anaconda3/envs/pytorch python=3.8

        其中C:/ProgramData/Anaconda3/envs 是创建的目录所在位置;/pytorch是所创建的环境的名称 python=3.8是创建的python的版本。
在这里插入图片描述

        可以看到,验证确实创建在我们想要的位置
在这里插入图片描述
        OK啦,创建成功:
在这里插入图片描述
在这里插入图片描述

3. conda常用命令:

 常用命令大全

  • 删除虚拟环境的代码如下(yolo5表示env名字) 
conda env remove -n yolo5
  • 激活虚拟环境
conda activate F:\Anaconda\envs\yolo5

4: 在跑模型时候遇到的一些问题:

4.1: conda添加python解释器找不到对应的python.exe文件

        网上有很多解决方法,我参考了这个:(也是用GPU训练的,如果解释器是anaconda虚拟环境中的python,那效果应该是一样的)

  • 直接在Virtualenv Enviroment中找conda的虚拟环境里的python.exe就可以
  • 直接在System Environment中找conda的虚拟环境就可以

4.2: 报错“OSError: [WinError 1455] 页面文件太小,无法完成操作。”

        这个好像和给cuda虚拟环境所在盘分配的虚拟内存有关:

        具体可以参考下边这个博客:

页面文件太小,无法完成操作。

4.3: 报错“CUDA out of memory. Tried to allocate 14.00 MiB

        这个应该是训练的模型所设置的batch-size太大了,GPU的显存满足不了

        把batch-size调小一些,如设置常用的256 128 64 32 16等,我是把yolov5中的16改为了8,然后问题就迎刃而解了。

        最后附上使用GPU训练yolov5模型成功的截图:

(之前用CPU跑同样规模的数据集跑了2个小时,用了GPU只需要16分钟,不得不说真香)

        显卡配置:(有钱一定换块好的)

5: CUDA11.1版本出现NAN的问题原因及解决措施: 

我在完成上述步骤后,出现了一些错误,具体表现为如下形式:

该问题出现的原因在于CUDA版本较高(11.1),最好采用10.2的CUDA版本 ,只需要在虚拟环境中安装10.2的cuda即可,不需要在系统中重新安装。

解决方法可以参考下述博客:

YOLOv5s GTX 1660 Ti训练时出现,box,obj,cla全是nan的问题P、R、mAP都是0,Pytorch和cuda、cudnn版本不对

GTX 16XX系显卡 yolov5训练结果出现NAN的问题

yolov5 训练自己的数据集后,检测不到目标的解决办法

此外,也可能是如下问题导致的:

服务器上训练好的yolov5数据集在自己电脑上什么都检测不出来(已解决)

6: 虚拟环境中的cuda和系统中cuda的区别:

https://blog.csdn.net/qq_42744739/article/details/118640226 

7: 对于动漫角色,训练效果不是很好 :

原本想训练一个自动识别视频中动漫角色(九柱)的模型,但是拿 恋柱——甘露寺蜜璃和水柱——富冈义勇做了小实验(每个选取了各40张图片,其中3张作为验证集),在batch_size=8的情况下epoch=200,最后只能实现识别这两个人物不会出太大问题,但是你喂给它一张猫或狗或者其他柱可能会识别错误(可能是因为数据集太小的缘故,同时动漫人物本身识别也较为困难)

大家如果有开源的鬼灭之刃数据集,可以考虑分享给bz一下,嘿嘿;有问题欢迎在评论区留言!

http://www.lryc.cn/news/217092.html

相关文章:

  • 【LeetCode刷题-链表】--146.LRU缓存
  • mysql 问题解答
  • 组件与Props:React中构建可复用UI的基石
  • 接口框架第二篇—unittest/pytest 有什么区别
  • Window 7 / 10 / 11 .bat .cmd 中文路径不识别解决方案
  • Linux命令(113)之rev
  • QT+SQLite数据库配置和使用
  • 若依分离版——配置多数据源(mysql和oracle),实现一个方法操作多个数据源
  • Seata入门系列【19】分布式事务之CAP、BASE理论
  • 界面控件DevExpress WPF Gauge组件 - 轻松实现个性化商业仪表盘
  • 算法题:870. 优势洗牌
  • [架构之路-252/创业之路-83]:目标系统 - 纵向分层 - 企业信息化的呈现形态:常见企业信息化软件系统 - 企业应用信息系统集成
  • MFC发送http https以及json解析
  • UE5加载websocket模块为空
  • 学习 Python 数据可视化,如何快速入门?
  • XUbuntu22.04之simplenote支持的Markdown语法总结(一百九十一)
  • JAVA深化篇_26——Apache commons-io工具包的使用
  • centos 7 kafka2.6单机安装及动态认证SASL SCRAM配置
  • TrafficWatch 数据包嗅探器工具
  • MySQL Binlog实战应用之一
  • 【MySQL】MVCC机制(undo log,read view)
  • gma 2 教程(三)坐标参考系统:3.投影方法
  • 蓝桥杯每日一题2023.11.2
  • Leetcode67二进制求和
  • 线性代数 第五章 特征值与特征向量
  • Python嵌入式数据库 / 轻量级数据库 / 小型数据库介绍(SQLite、Pandas DataFrame、TinyDB)(python数据库)
  • USB PD v1.0快速充电通信原理
  • 【华为】路由器以PPPoE拨号接入广域网
  • Linux内核分析(一)--内核架构和子系统
  • 【PyQt学习篇 · ⑨】:QWidget -控件交互