当前位置: 首页 > news >正文

Segment anything(图片分割大模型)

目录

1.Segment anything

 2.补充图像分割和目标检测的区别


1.Segment anything

定义:图像分割通用大模型

延深:可以预计视觉检测大模型,也快了。

进一步理解:传统图像分割对于下图处理时,识别房子的是识别房子的模型,识别草的是识别草的模型,识别人的是识别人的模型,而Segment anything可一次识别所有物体。可以这样说以前我们的模型是训练得到几个,几十个,几千个标签,而Segment anything可以得到所有标签,

再进一步理解:chagpt在实现文本任务时我们发现,他同样是聚焦所有点,只需要几个提示词去引导它,对应下图,比方说,找到图中病毒或者找到图中蓝色区域。在 Segment anything同样是这个道理,我们对图中想要识别的对象,点三个点(提示词),模型便知道你想识别这个对象。也可以用一个框(提示词)对这个对象作为指导。通用大模型不用一次把所有东西都训练好,在有大模型后,有提示词,可以持续学习。

 2.补充图像分割和目标检测的区别

定义:在这两个任务中,我们都希望找到图像中某些感兴趣的项目的位置,比如说图中人的位置。从输出理解两者区别

              1. 目标检测:预测包围盒(对于下面的狗只用框框起来即可
              YOLO,Fast-RCNN,似乎还有个SSD
              输入:一个矩阵(输入图像),每个像素有 3 个值(红、绿、蓝),如果是黑色和白色,则每个像素有 1 个值。
              输出:由左上角和大小定义的边框列表。

              2. 图像分割:预测掩模(对下面的狗比方说,红色的狗,周边标注时要对每一个像素点标注,过于麻烦
              Mask RCNN,Unet,Segnet
             输入:是一个矩阵(输入图像),每个像素有 3 个值(红、绿、蓝),如果是黑色和白色,则每个像素有 1 个值
             输出:是一个矩阵(掩模图像),每个像素有一个包含指定类别的

             结论:输出不同,从下图理解二者区别:简单理解目标检测在图中表现为框,图像分割是一种类别的颜色。

补充一下语义分割和实例分割

        语义分割:(图片分割)是对图像中的每一块像素都应该给出类别标签。

        实例分割:(目标检测)只需要给出我们关注的物体的像素的类别标签。

        结论:两者其实没有本质的区别。



参考文献

1.分割一切!刷爆CV圈子的视觉终极模型Segment Anything(SAM),唐宇迪博士两小时原理精讲、源码复现带你实操!_哔哩哔哩_bilibili

2.图像分割与目标检测与区别_图像分割和目标检测区别_必修居士的博客-CSDN博客

3.计算机视觉:图像检测和图像分割有什么区别?_图像识别与分割_喜欢打酱油的老鸟的博客-CSDN博客

http://www.lryc.cn/news/105560.html

相关文章:

  • 【雕爷学编程】MicroPython动手做(27)——物联网之掌控板小程序3
  • Java中集合容器详解:简单使用与案例分析
  • 机器学习04-数据理解之数据可视化-(基于Pima数据集)
  • 百度@全球开发者,见证中国科技超级“碗”!
  • 分库分表之基于Shardingjdbc+docker+mysql主从架构实现读写分离(一)
  • Ajax跨域问题
  • Vue + FormData + axios实现图片上传功能
  • 设计模式系列:经典的单例模式
  • macbook pro 散热解决办法
  • 高并发与性能优化的神奇之旅
  • Django Rest_Framework(一)
  • VB+ACCESS智能公交考勤系统管理软件设计与实现
  • 企业电子招标采购系统源码Spring Boot + Mybatis + Redis + Layui + 前后端分离 构建企业电子招采平台之立项流程图 tbms
  • 【ES】笔记-ECMAScript 相关介绍
  • FFmpeg下载安装及Windows开发环境设置
  • transformer面试常考题
  • aws的EC2云服务器
  • hive函数大全
  • k8s概念-StatefulSet
  • HTMLCollection 和 NodeList 的详解,以及两者在开发情况下差异。
  • 基于FPGA的超声波测距——UART串口输出
  • Python web实战之 Django 的 MVC 设计模式详解
  • Stable Diffusion VAE:改善图像质量的原理、选型与使用指南
  • maven里面没有plugins dependence问题解决
  • Wi-Fi 6技术详解
  • 【LeetCode】446. 等差数列划分II -- 子序列
  • 几个似非而是的注释问题
  • 【设计模式|上】创建型模式
  • 【JS】类 class
  • Ubuntu安装harbor(http模式)并随便上传一个