当前位置: 首页 > news >正文

【MMdetection改进】换遍MMDET主干网络之SwinTransformer-Tiny(基于MMdetection)

OpenMMLab 2.0 体系中 MMYOLO、MMDetection、MMClassification、MMSelfsup 中的模型注册表都继承自 MMEngine 中的根注册表,允许这些 OpenMMLab 开源库直接使用彼此已经实现的模块。 因此用户可以在MMYOLO 中使用来自 MMDetection、MMClassification、MMSelfsup 的主干网络,而无需重新实现。

Swin Transformer做主干的 Faster RCNN 目标检测网络(mmdetection)

在这里插入图片描述

1. 在configs/swin 目录下新建文件:faster_rcnn_swin_t-p4-w7_fpn_1x_coco.py

文件内容如下:
**注意:**训练的epoch在这个文件中改,大家根据需要修改。

_base_ = ['../_base_/models/faster_rcnn_r50_fpn.py','../_base_/datasets/coco_instance.py','../_base_/schedules/schedule_1x.py', '../_base_/default_runtime.py'
]
pretrained = 'https://github.com/SwinTransformer/storage/releases/download/v1.0.0/swin_tiny_patch4_window7_224.pth'  # noqa
model = dict(#type='MaskRCNN',type='FastRCNN',backbone=dict(_delete_=True,type='SwinTransformer',embed_dims=96,depths=[2, 2, 6, 2],num_heads=[3, 6, 12, 24],window_size=7,mlp_ratio=4,qkv_bias=True,qk_scale=None,drop_rate=0.,attn_drop_rate=0.,drop_path_rate=0.2,patch_norm=True,out_indices=(0, 1, 2, 3),with_cp=False,convert_weights=True,init_cfg=dict(type='Pretrained', checkpoint=pretrained)),neck=dict(in_channels=[96, 192, 384, 768]))optimizer = dict(_delete_=True,type='AdamW',lr=0.0001,betas=(0.9, 0.999),weight_decay=0.05,paramwise_cfg=dict(custom_keys={'absolute_pos_embed': dict(decay_mult=0.),'relative_position_bias_table': dict(decay_mult=0.),'norm': dict(decay_mult=0.)}))
lr_config = dict(warmup_iters=1000, step=[8, 11])
runner = dict(max_epochs=12)

Swin Transformer做主干的Cascade R-CNN 目标检测网络(mmdetection)

1. 在configs/swin 目录下新建文件:cascade_rcnn_swin_t-p4-w7_fpn_1x_coco.py

文件内容如下:
**注意:**训练的epoch在这个文件中改,大家根据需要修改。

_base_ = ['../_base_/models/cascade_rcnn_r50_fpn.py','../_base_/datasets/coco_detection.py','../_base_/schedules/schedule_1x.py', '../_base_/default_runtime.py'
]
pretrained = 'https://github.com/SwinTransformer/storage/releases/download/v1.0.0/swin_tiny_patch4_window7_224.pth'  # noqa
model = dict(#type='MaskRCNN',type='CascadeRCNN',backbone=dict(_delete_=True,type='SwinTransformer',embed_dims=96,depths=[2, 2, 6, 2],num_heads=[3, 6, 12, 24],window_size=7,mlp_ratio=4,qkv_bias=True,qk_scale=None,drop_rate=0.,attn_drop_rate=0.,drop_path_rate=0.2,patch_norm=True,out_indices=(0, 1, 2, 3),with_cp=False,convert_weights=True,init_cfg=dict(type='Pretrained', checkpoint=pretrained)),neck=dict(in_channels=[96, 192, 384, 768]))optimizer = dict(_delete_=True,type='AdamW',lr=0.0001,betas=(0.9, 0.999),weight_decay=0.05,paramwise_cfg=dict(custom_keys={'absolute_pos_embed': dict(decay_mult=0.),'relative_position_bias_table': dict(decay_mult=0.),'norm': dict(decay_mult=0.)}))
lr_config = dict(warmup_iters=1000, step=[8, 11])
runner = dict(max_epochs=12)
http://www.lryc.cn/news/425218.html

相关文章:

  • FL Studio21.2.4最新中文版免费下载汉化包破解补丁
  • 私域场景中的数字化营销秘诀
  • 一键换肤(Echarts 自定义主题)
  • Unity 6 预览版正式发布
  • 如何跳过极狐GitLab 密钥推送保护功能?
  • Android高版本抓包总结
  • 《AI视频类工具之五——​ 开拍》
  • 面试经典算法150题系列-最后一个单词的长度
  • RTT学习
  • 前端面试题(二十五)|附赠完整面试流程
  • 【分布式系统】关于主流的几款分布式链路追踪工具
  • 【吸引力法则】探究人生欲:追求深度体验与宇宙链接
  • REST framework-通用视图[Generic views]
  • 行驶证OCR识别接口如何用Java调用
  • 8月15日笔记
  • CSS3 圆角
  • VUE项目中main.js中不能使用 @引入路径吗
  • Spring日志
  • 年薪30万+,TOP大厂月薪10万+....网络安全工程师凭什么?
  • WebView 的常见的安全漏洞:
  • 【python】Python中subprocess模块的参数解读以及应用实战
  • opencv-python实战项目十一:背景减除法制作运动行人蒙版
  • 安防监控/视频汇聚平台EasyCVR如何配置,实现默认获取设备的子码流?
  • JavaScript基础——闭包
  • Linux基础入门---安装vmware
  • 用AppleScript点击无效,继续用pyautogui.click()
  • 谈谈我用MemFire Cloud开发应用的这一两年
  • AI安全-文生图
  • Hibernate 使用详解
  • 乐普医疗校招社招笔试/测评通关攻略、最新北森题库、可搜索答案