当前位置: 首页 > news >正文

论文阅读——Semantic-SAM

Semantic-SAM可以做什么:

整合了七个数据集:

一般的分割数据集,目标级别分割数据集:MSCOCO, Objects365, ADE20k

部分分割数据集:PASCAL Part, PACO, PartImagenet, and SA-1B

The datasets are SA-1B, COCO panoptic, ADE20k panoptic, PASCAL part, PACO, PartImageNet, and Objects365

COCO 和 ADE20k 有目标级别mask和类别标签的全景分割数据集;PASCAL part, PACO, and PartImageNet 部分分割的masks和类别标签. SA-1B 包括 6-level masks without labels; Objects365 有大量目标实例类别标签。

Semantic-SAM

支持point and box

把输入的点和坐标统一成形式:(x, y)-->(x, y, w, h),w, h非常小。

b = (x, y, w, h)

一个点击或者box,编码为一个位置向量和K(K=6)个内容向量(查询向量)Q = (q1, · · · , qK)。

输入坐标、图片特征、内容查询向量,得到每个查询的输出查询特征。

训练:

目标级别分割和部分分割解耦:

不同数据集对应的损失项:

训练时和GT匹配问题;

SAM是多对一的,即三个SAM预测masks只对应一个GT mask。

对同一点击位置的不同GT masks聚类,然后使用Hungarian algorithm多对多匹配。

相似性矩阵和分数根据不同分割数据成分的可用性而变化。

结果:

http://www.lryc.cn/news/261061.html

相关文章:

  • gitlab下载,离线安装
  • 【SpringBoot篇】Interceptor拦截器 | 拦截器和过滤器的区别
  • conan入门(三十六):在set_version方法中从pom.xml中读取版本号实现动态版本定义
  • 为什么 GAN 不好训练
  • select、poll、epoll 区别有哪些
  • 大模型下开源文档解析工具总结及技术思考
  • 【华为数据之道学习笔记】5-4 数据入湖方式
  • Vue3-03-reactive() 响应式基本使用
  • OpenAI开源超级对齐方法:用GPT-2,监督、微调GPT-4
  • TeeChart.NET 2023.11.17 Crack
  • 计算机网络常见的缩写
  • vue cli 脚手架之配置代理
  • STM32启动流程详解(超全,startup_stm32xx.s分析)
  • 小程序接口OK,桌面调试接口不行
  • 【贪心】LeetCode-406. 根据身高重建队列
  • 【C++11特性篇】C++11中新增的initializer_list——初始化的小利器
  • springboot(ssm宠物美容机构CRM系统 宠物服务商城系统Java系统
  • LSTM 双向 Bi-LSTM
  • 2024测试开发面试题完整版本(附答案)
  • MySQL作为服务端的配置过程与实际案例
  • Appium 自动化自学篇 —— 初识Appium自动化!
  • Linux基本操作指令
  • 探索SD-WAN技术对传统制造业实现智能制造的作用
  • C++基础-this指针详解
  • 如何一键生成多个文件二维码?批量文件二维码制作技巧
  • SQL连续
  • sql server导出与导入
  • DevEco Studio 项目鸿蒙(HarmonyOS)资源引用(自定统和系统)
  • 使用国内镜像源安装opencv
  • 人工智能与大数据的紧密联系