当前位置: 首页 > news >正文

DiffusionDet: Diffusion Model for Object Detection

DiffusionDet: Diffusion Model for Object Detection

  • 论文概述
  • 不同之处
  • 整体流程

在这里插入图片描述
论文题目:DiffusionDet: Diffusion Model for Object Detection
论文来源:arXiv preprint 2022
论文地址:https://arxiv.org/abs/2211.09788
论文代码:https://github.com/ShoufaChen/DiffusionDet

DDPM
DDIM

论文概述

传统方法根据经验设计region proposals/anchor boxes/queries等
本文可从随机初始化的boxes进行回归和分类
方法概述:
在这里插入图片描述

生成模型:从噪声到图像/从随机的框到精确的框

在这里插入图片描述

模型架构图

不同之处

在这里插入图片描述

整体流程

在这里插入图片描述
在这里插入图片描述

训练阶段:

  1. 初始化一组boxes,并逐渐加入高斯噪声,得到noisy boxes
  2. 使用ResNet/Swin Transformer作为encoder提取特征
  3. 用noisy boxes从2.得到的特征中裁剪出RoI
  4. 将3.中的RoI送入detection decoder,用于预测真值,计算损失

推理阶段:

  1. 随机初始化高斯噪声noisy boxes;用encoder提取特征
  2. 迭代多次:
    将当前的noisy boxes送入decoder,预测目标框;
    (DDIM)传入当前noisy boxes和预测的目标框,预测上一时刻分布;
    (Box renewal)根据阈值筛去undesired框,再加入噪声
http://www.lryc.cn/news/127004.html

相关文章:

  • CH01_重构、第一个示例
  • 学习篇之React Fiber概念及原理
  • 商城-学习整理-高级-全文检索-ES(九)
  • 无人机跟随一维高度避障场景--逻辑分析
  • Android Studio Giraffe控制台乱码
  • 云原生 envoy xDS 动态配置 java控制平面开发 支持restful grpc实现 EDS 动态endpoint配置
  • Linux--实用指令与方法(部分)
  • 常见期权策略类型有哪些?
  • tomcat服务七层搭建动态页面查看
  • sql A表(含有部分B表字段) 向B表插入A表数据
  • 如何用思维导图+Markdown提升工作效率?
  • 睿趣科技:抖音开网店现在做还来得及吗
  • C++——list的简要介绍
  • Java自学网站推荐,专业教学快速提升
  • 深入学习SpringCloud Alibaba微服务架构,揭秘Nacos、Sentinel、Seata等核心技术,助力构建高效系统!
  • 【iMessage频發软件苹果群发技术开源原创】当 APNs 发送通知到一个离线设备时,APNs 会把通知存储起来(一定的时间内),当设备上线时再递送给设备。
  • 【数据结构】_8.二叉树OJ
  • 酷开系统 | 酷开科技大数据,更好的与目标消费人群建立联系
  • 无涯教程-Perl - study函数
  • dfs深度搜索入门之滑雪
  • Python程序设计——元组、集合和字典
  • 八股文之框架篇(Spring Boot、SSM)
  • [PaddlePaddle] [学习笔记] [上] 计算机视觉(卷积、卷积核、卷积计算、padding计算、BN、缩放、平移、Dropout)
  • 【JS 贪心算法常见步骤】
  • 应用案例|基于三维机器视觉的机器人纸箱拆码垛应用解决方案
  • 【ARM 嵌入式 编译 Makefile 系列 10 - Makefile sort 函数详细介绍】
  • Flask下载文件报错304 NOT MODIFIED
  • AI Chat 设计模式:15. 桥接模式
  • Python批量替换Excel和Word中的关键字
  • Codeforces算法心得——A. Array Coloring