当前位置: 首页 > news >正文

Painter:使用视觉提示来引导网络推理

文章目录

      • 1. 论文
      • 2. 示意图
      • 3. 主要贡献
      • 4. 代码简化

1. 论文

在这里插入图片描述
paper:Images Speak in Images: A Generalist Painter for In-Context Visual Learning
github:https://github.com/baaivision/Painter

2. 示意图

在这里插入图片描述

3. 主要贡献

在 In-context Learning 中,作为自然语言处理的一种新范式,使模型能够仅凭少数提示和示例迅速适应各种任务。但在计算机视觉领域, In-context Learning 的难点在于任务的输出表示方式差异很大,因此不清楚如何定义通用任务提示,以便视觉模型能够理解并应用到领域外的任务。在这项工作中 Painter 将核心视觉任务的输出重新定义为图像,并将任务提示也指定为图像。基于这个想法,训练过程非常简单,即对输入和输出图像对的组合执行标准的遮蔽图像建模。这使得模型能够执行基于可见图像补丁的任务。因此,在推断过程中,可以采用来自相同任务的一对输入和输出图像作为输入条件,以指示要执行哪个任务。没有那些花里胡哨的 trick,Painter在七个代表性的视觉任务上表现出与成熟的任务特定模型相媲美的性能,这些任务涵盖了从高级视觉理解到低级图像处理的各种领域。此外,Painter在几项具有挑战性的任务上明显优于最近的通用模型。

4. 代码简化

由于原项目的代码比较繁琐,对于各种不同的数据集有比较复杂的加载方式,我对他们的代码进行简化,从而令初学者能够快速利用自己的任务或者图像进行测试,需要注意的是这里我删除了关于训练的代码。链接:Painter:使用视觉提示visual prompt来引导网络推理超精简代码。以下是简化前后的代码结构对比。
简化前的代码结构:
在这里插入图片描述
简化后的代码结构:
在这里插入图片描述

http://www.lryc.cn/news/208182.html

相关文章:

  • Fedora Linux 38 安装数学动画制作工具manimgl工具包
  • 行业追踪,2023-10-26
  • Android 和 iOS APP 测试的那些区别
  • 利用nicegui开发ai工具示例
  • HarmonyOS鸿蒙原生应用开发设计- 流转图标
  • postgresql14管理(六)-备份恢复
  • 配置Sentinel 控制台
  • 【漏洞复现】酒店宽带运营系统RCE
  • Autojs 利用OpenCV识别棋子之天天象棋你马没了
  • 好数组——尺取法
  • 【Linux】Ubuntu升级nodejs版本
  • 二维码智慧门牌管理系统升级解决方案:一级属性 二级属性
  • input改造文件上传,el-table的改造,点击上传,拖拽上传,多选上传
  • 申请实用新型专利需要的时间
  • Redis 主从复制和哨兵监控,实现Redis高可用配置
  • 虹科直播 | CDS网络与数据安全专题技术直播重磅来袭,11.2起与您精彩相约
  • nginx加权轮询,upstream,Keepalive,负载均衡实现案例
  • java代理示例
  • 51单片机汽车胎压大气气压测量仪仿真设计_数码管显示(代码+仿真+设计报告+讲解)
  • mac idea 解决0% classes 0% lines covered不显示,非快捷键办法
  • Fabric.js 复制粘贴元素
  • rstudio server 服务器卡死了怎么办
  • 贪心算法学习——加油站
  • Android 字符串工具类
  • 有了InheritableThreadLocal为啥还需要TransmittableThreadLocal?
  • 结构伪类选择器
  • java-- 静态数组
  • 世界经济论坛:ChatGPT等生成式AI,对全球23%岗位产生巨大影响
  • myTracks for Mac:GPS轨迹记录器的强大与便捷
  • Macos视频增强修复工具:Topaz Video AI for mac