当前位置: 首页 > news >正文

MATLAB神经网络(五)——R-CNN视觉检测

5.1 目标分类、检测与分割

        在计算机视觉领域,目标分类、检测与分割是常用计数。三者的联系与区分又在哪呢?目标分类是解决图像中的物体是什么的问题;目标检测是解决图像中的物体是什么,在哪里的问题;目标分割时将目标和背景分离出来,找出目标的轮廓线。

        衡量目标检测性能优劣的指标一方面要体现分类特性(准确度、精确率、召回率),另一方面要体现其定位特征,对于定位特征,通常用IoU来评价。交并比用来计算两个边界框交集和并集和并集之比,它衡量了两个边界框的重叠程度,如果重叠程度越高,检测越准确

5.2 R-CNN目标检测算法原理与实现

        R-CNN利用候选区域+卷积神经网络的方法,解决了图像中的定位问题,对于小规模数据集的问题,R-CNN利用AlexNet在ImageNet上预训练好的模型,基于迁移学习的原理,对参数进行微调。

     

        第一步:首先会有很多候选框区域,这些区域是由图像分割的方法得到的原始区域然后进行合并,得到的一个层次化的区域,这些区域内就可能存在需要的内容

        第二步:因为使用的为AlexNet,上一章我们很详细的说明了。将我们的候选区域压缩到  227*227,输入到神经网络中获得4096维的矩阵,每个候选区域都有一个矩阵。

        第三步:判断类别,候选框个数*4096特征与20哥SVM支持向量机组成的全职矩阵 4096*20,获得  2000 * 20维矩阵,分别对上述2000×20维矩阵中每一列即每一类进行非极大值抑制剔除重叠建议框,得到该列即该类中得分最高的一些建议框。

         SVM是线性分类器,相当于绘出一条线,让两组不同的数据距离他的距离最远。

        最后修正这个框,得到得分最高的框

  基于上面的过程,下面给出步骤:

        首先通过Image Labeler App构建R-CNN目标检测器,并导入图片

        并利用标签对图像进行标志

        标签完成后导出到工作空间内

trainingdate=objectDetectorTrainingData(gTruth);

        objectDetectorTrainingData函数可以将我们上面导出的图片转换为用于训练的数据,就可以导入网络进行使用了,给出完整代码如下:

%%  进行数据类型的转化
trainingdate=objectDetectorTrainingData(gTruth);
%%  导入网络
net=alexnet;
%%  设置训练策略参数并进行训练
% 设置训练策略参数
options = trainingOptions('sgdm', ...'MiniBatchSize', 128, ...'InitialLearnRate', 1e-3, ...'LearnRateSchedule', 'piecewise', ...'LearnRateDropFactor', 0.1, ...'LearnRateDropPeriod', 100, ...'MaxEpochs',10, ...'Verbose', true);% 训练网络.rcnn = trainRCNNObjectDetector(trainingdate, net, options, ...'NegativeOverlapRange', [0 0.3], 'PositiveOverlapRange',[0.5 1]) ;%%  显示测试结果
% 读取数据
I = imread('E:\MATLAB_DeepLearning\chapter_9\stop_sign_ch\slowtest.jpg');
% 用检测器测试
[bboxes,scores] = detect(rcnn,I);
% 标注测试结果并显示
I = insertObjectAnnotation(I,'rectangle',bboxes,scores);
figure
imshow(I)

效果如下:

111                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           

http://www.lryc.cn/news/488923.html

相关文章:

  • mock.js:定义、应用场景、安装、配置、使用
  • 【GAT】 代码详解 (1) 运行方法【pytorch】可运行版本
  • Transformer中的Self-Attention机制如何自然地适应于目标检测任务
  • 2411rust,1.75.0
  • 远程办公新宠:分享8款知识共享软件
  • 3.9MayBeSomeAssembly
  • i春秋-签到题
  • TypeScript 中扩展现有模块的用法
  • 【报错记录】解决Termux中pulseaudio启动报错,报:E: [pulseaudio] main.c: Daemon startup failed.
  • Java list
  • MAC借助终端上传jar包到云服务器
  • 对原jar包解压后修改原class文件后重新打包为jar
  • YY币支付系统改源码(改良版本)
  • 【Swift】类型标注、类型安全和类型推断
  • 06 —— Webpack优化—压缩过程
  • uniapp页面样式和布局和nvue教程详解
  • 单条推理转批量推理prompt
  • 网络安全审计概述与分类
  • 【已解决】“EndNote could not connect to the online sync service”问题的解决
  • 数据脱敏工具:基于 FFmpeg 的视频批量裁剪
  • Debezium日常分享系列之:Debezium3版本Debezium connector for JDBC
  • 「Mac玩转仓颉内测版24」基础篇4 - 浮点类型详解
  • 【UGUI】Unity 背包系统实现02:道具信息提示与显示
  • 掌握移动端性能测试利器:深入JMeter手机录制功能
  • springboot010大学生入学审核系统的设计与实现(源码+包运行+LW+技术指导)
  • Qt/C++离线地图的加载和交互/可以离线使用/百度和天地图离线/支持手机上运行
  • 从繁琐到优雅:用 PyTorch Lightning 简化深度学习项目开发
  • UE5 第一人称射击项目学习(完结)
  • Banana Pi BPI-CanMV-K230D-Zero 采用嘉楠科技 K230D RISC-V芯片设计
  • 【vim】使用 gn 组合命令实现搜索选中功能