当前位置: 首页 > news >正文

基于YOLOv11的无人机目标检测实战(Windows环境)

1. 环境搭建

1.1 硬件与操作系统

  • 操作系统:Windows 11

  • CPU:Intel i7-9700

  • GPU:NVIDIA RTX 2080(8GB显存)

1.2 安装CUDA和cuDNN

由于YOLOv11依赖PyTorch的GPU加速,需要安装CUDA和cuDNN:

  1. 安装CUDA Toolkit

    • 访问 NVIDIA CUDA 下载页面

    • 选择 CUDA 11.8(兼容PyTorch 2.0+)

    • 运行安装程序,选择默认选项

  2. 安装cuDNN

    • 访问 NVIDIA cuDNN 下载页面

    • 下载 cuDNN 8.9.0 for CUDA 11.x

    • 解压后,将 binincludelib 文件夹复制到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8

  3. 验证CUDA安装

    nvcc --version
    nvcc: NVIDIA (R) Cuda compiler
    release 11.8, V11.8.89

1.3 安装Python、Anaconda和PyCharm

  1. 安装Python 3.9

    • 从 Python官网 下载 Python 3.9.19

    • 安装时勾选 "Add Python to PATH"

  2. 安装Anaconda

    • 下载 Anaconda

    • 安装后,创建YOLOv11专用环境:

      conda create -n yolov11 python=3.9.19
      conda activate yolov11
  3. 安装PyCharm

    • 下载 PyCharm Community

    • 配置Python解释器为 yolov11 环境


2. 数据集准备

2.1 选择1000张无人机图片

drone_dataset/
├── images/
│   ├── train/  # 800张训练图片
│   └── val/    # 200张验证图片
└── labels/├── train/  # 训练集标注(YOLO格式)└── val/    # 验证集标注

2.2 标注数据

  1. 作者采用wpf开发的标注工具,点击下载

  2. 标注流程

    • 打开图片文件夹(images/train

    • 选择 YOLO格式 输出

    • 标注无人机目标,保存为 .txt 文件(格式:<class_id> <x_center> <y_center> <width> <height>


3. YOLOv11训练

3.1 安装依赖

pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118
pip install ultralytics opencv-python matplotlib

3.2 准备YOLO配置文件

  1. 创建 drone.yaml

    path: ./drone_dataset
    train: images/train
    val: images/val
    names:0: drone
  2. 下载YOLOv11预训练模型

    wget https://github.com/WongKinYiu/yolov11/releases/download/v0.1/yolov11s.pt

3.3 训练模型

from ultralytics import YOLOmodel = YOLO("yolov11s.pt")  # 加载预训练模型results = model.train(data="drone.yaml",epochs=100,imgsz=640,batch=16,  # RTX 2080适合batch=16device=0,  # 使用GPUoptimizer="SGD",amp=True,  # 混合精度训练project="runs/train",name="drone_exp"
)
关键参
数说明
  • batch=16:RTX 2080显存8GB,适合batch=16

  • imgsz=640:无人机目标较小,建议高分辨率

  • amp=True:混合精度训练,节省显存


4. WPF可视化验证

将pt模型转出通用模型onnx

from ultralytics import YOLOfrom ultralytics import YOLO
model = YOLO("./runs/detect/train7/weights/best.pt")
model.export(format="onnx", imgsz=(640, 640), simplify=True)

作者使用C#开发了一款程序,能够加载ONNX模型并进行图像检测。


5. 常见问题

Q1: CUDA报错 "out of memory"

  • 解决方案:降低 batch 大小(如 batch=8

Q2: 标注数据不准确

  • 解决方案:使用 Roboflow 自动增强数据集

Q3: WPF调用Python模型慢

  • 优化方案:改用 ONNX Runtime 或 TensorRT 加速


6. 总结

本文详细介绍了在 Windows 11 + RTX 2080 环境下:

  1. 配置CUDA/cuDNN + Python环境

  2. 标注1000张无人机数据集

  3. 训练YOLOv11模型

  4. 使用WPF开发可视化检测程序

http://www.lryc.cn/news/586762.html

相关文章:

  • Spring Cloud Gateway 实战指南
  • 力扣经典算法篇-21- 两数之和 II - 输入有序数组(固定一端 + 二分查找法,双指针法)
  • MongoDB性能优化实战指南:原理、实践与案例
  • git实际工作流程
  • 【零基础入门unity游戏开发——unity3D篇】3D光源之——unity反射和反射探针技术
  • SPSSPRO:数据分析市场SaaS挑战者的战略分析
  • 深入解析Hadoop架构设计:原理、组件与应用
  • (2)从零开发 Chrome 插件:实现 API 登录与本地存储功能
  • 代码随想录|图论|14有向图的完全可达性
  • 基于Prompt结构的语校解析:3H日本语学校信息建模实录(4/500)
  • Java求职面试:从Spring到微服务的全面挑战
  • AI进化论12:大语言模型的爆发——GPT系列“出圈”,AI飞入寻常百姓家
  • 碳水循环(增肌、减脂)
  • VISUALBERT:一个简单且高效的视觉与语言基线模型
  • 【读书笔记】《Effective Modern C++》第3章 Moving to Modern C++
  • 14.ResourceMangaer启动解析
  • .NET + WPF框架开发聊天、网盘、信息发布、视频播放功能
  • 股指期货的三种风险类型是什么?
  • 15.手动实现BatchNorm(BN)
  • Linux中的数据库操作基础
  • pycharm+SSH 深度学习项目 远程后台运行命令
  • python爬取新浪财经网站上行业板块股票信息的代码
  • 【读书笔记】《C++ Software Design》第七章:Bridge、Prototype 与 External Polymorphism
  • cuda编程笔记(7)--多GPU上的CUDA
  • UniHttp生命周期钩子与公共参数实战:打造智能天气接口客户端
  • jenkins部署前端vue项目使用Docker+Jenkinsfile方式
  • 财务管理体系——解读大型企业集团财务管理体系解决方案【附全文阅读】
  • 算法入门--动态规划(C++)
  • 傅里叶变换中相位作用
  • 通过同态加密实现可编程隐私和链上合规