当前位置: 首页 > news >正文

Mask R-CNN实战

一、源码和数据集的准备

获取git开源项目代码

https://github.com/matterport/Mask_RCNN

一下载2.1的前三个文件,和2.0的第一个h5文件,coco.h5是预训练权重,也放入源码

 

项目文件结构如下:

samples/logs:训练模型保存的位置

配置好环境。尽量它用啥版本就安装什么版本。Requirements

遇到问题先到git中的问题,搜索。

二、使用

项目文件代码很多!!!

核心文件model.py

utils.py辅助小方法

先samples/ballon.py/logs/balloon.py

训练配置参数

train

--dataset=../../balloon

--weights=coco

测试配置参数

splash

--weight=./logs/balloon20191023T1451/mask_rcnn_balloon_0030.h5  #训练好的模型或者别人的模型

--image=../../balloon/val/14898532020_ba6199dd22_k.jpg

三、原理

FPN层的作用

R_CNN中仅使用最后一层特征图进行特征提取,但是顶层特征中忽略了小物体的一些信息使得检测效果并不好,这该如何改进?

FPN:金字塔网络

FPN思想:将多个阶段特征(卷积之后得到特征,先掌握Resnet)图融合在一起,这就相当于有了高层的语义特征,也就有了低层的轮廓特征。

FPN层的作用:
Resnet101的五个阶段
不改变特征图大小的层归为一个阶段
每次抽取的特征都是每个阶段的最后一层的输出
问题:特征图大小会发生变化,如何融合呢?

五个损失函数

http://www.lryc.cn/news/355898.html

相关文章:

  • 02--SpringBoot自动装配原理
  • 【加密与解密(第四版)】第十二章笔记
  • 高并发幂等计数器【面试真题】
  • 设计软件有哪些?建模和造型工具篇(3),渲染100邀请码1a12
  • 无人机+EasyDSS互联网视频平台:构建秸秆焚烧监控的“天眼”系统
  • 【UE5.1 角色练习】06-角色发射火球-part2
  • 多系统集成的项目周期为何普遍较长?
  • 【LaTex】11 ACM参考文献顺序引用 - 解决 ACM-Reference-Format 顺序不符合论文实际引用顺序的问题
  • selenium 学习笔记(一)
  • Nginx-04-Docker Nginx
  • Rust一维Vec垂直方向拼接、水平方向拼接,多个二维Vec垂直方向拼接
  • 低代码与人工智能:改变软件开发的未来
  • 第三方软件检测机构要具备哪些资质要求?专业测试报告如何申请?
  • 快团团帮卖团长怎么对供货大团长进行评分?
  • 双向带头链表实现
  • 黑马python-面向对象程序设计
  • pod容器基础概念
  • AI日报:百度发布文心大模型学习机;Open-Sora 1.1可生成21秒视频;Canva可以自动剪辑视频了;超牛ComfyUI节点AnyNode来了
  • VUE3+TS+elementplus+Django+MySQL实现从数据库读取数据,显示在前端界面上
  • 用c++做贪吃蛇
  • 【UE5.1 角色练习】08-传送技能
  • 力扣283题:移动零(快慢指针)
  • Java面试精粹:高级问题与解答集锦(一)
  • Yourpassword does not satisfy the current policyrequirements
  • 解决vue3 vite打包报Root file specified for compilation问题
  • Java Swing + MySQL图书借阅管理系统
  • ssm招聘信息管理系统-计算机毕业设计源码78049
  • eBPF可观测之网络流量控制和管理traffic control浅尝
  • Java技术精粹:高级面试问题与解答指南(二)
  • 地下停车场FM信号覆盖系统技术原理用与应用