当前位置: 首页 > news >正文

【图像处理基石】Segment Anything Model (SAM) 调研

在这里插入图片描述

Segment Anything Model (SAM) 是由 Meta AI 开发的革命性图像分割模型,它能够对图像中的任何物体进行分割,无需针对特定类别进行训练。SAM 具有以下特点:

  • 通用性:可以分割任何视觉对象,无论是否见过该类别
  • 灵活性:支持多种输入提示(点、框、掩码或文本)
  • 实时性:在普通 GPU 上可实现实时分割
  • 零样本迁移能力:可直接应用于新的图像分布和任务

SAM 的核心是一个Transformer架构的编码器和一个轻量级解码器,能够根据输入提示高效生成高质量的分割掩码。

使用代码案例

以下是使用 Segment Anything Model 进行图像分割的示例代码:

import numpy as np
import torch
import matplotlib.pyplot as plt
from PIL import Image
import requests
from io import BytesIO
from segment_anything import sam_model_registry, SamPredictor# 设置中文字体
plt.rcParams["font.family"] = ["SimHei", "WenQuanYi Micro Hei", "Heiti TC"]def load_image(url):"""从URL加载图像"""response = requests.get(url)image = Image.open(BytesIO(response.content)).convert("RGB")return np.array(image)def show_mask(mask, ax, random_color=False):"""显示分割掩码"""if random_color:color = np.concatenate([np.random.random(3), np.array
http://www.lryc.cn/news/601312.html

相关文章:

  • MGRE综合实验
  • 望言OCR视频字幕提取2025终极评测:免费版VS专业版提全方位对比(含免费下载)
  • 20250707-2-Kubernetes 网络-Ingress暴露应用(http与https)_笔记
  • Flutter中实现页面跳转功能
  • iOS安全和逆向系列教程 第21篇:iOS应用加密与混淆技术深度剖析
  • macOS配置 GO语言环境
  • mac电脑安装docker图文教程
  • 智慧施工:施工流程可视化管理系统
  • 【秋招笔试】7月26日科大讯飞秋招第二题
  • 算法竞赛阶段二-数据结构(37)数据结构动态链表list
  • DDPM:重新定义图像生成的革命性技术
  • Ubuntu Linux 如何配置虚拟内存 —— 一步一步配置 Ubuntu Server 的 NodeJS 服务器详细实录8
  • RabbiteMQ安装-ubuntu
  • Android CameraX 使用指南:简化相机开发
  • Keepalived + LVS-DR 高可用与负载均衡实验
  • ubuntu 部署 coze-loop
  • [10月考试] F
  • Java 后端 Cookie Session Token会话跟踪技术
  • LabelMe数据标注软件介绍和下载
  • cmake入门学习
  • VScode 支持 QNX 源码跳转
  • JavaWeb(苍穹外卖)--学习笔记13(微信小程序开发,缓存菜品,Spring Cache)
  • 中级全栈工程师笔试题
  • JavaScript数组去重性能优化:Set与Object哈希表为何效率最高
  • 影刀RPA_初级课程_玩转影刀自动化_网页操作自动化
  • 【多模态】天池AFAC赛道四-智能体赋能的金融多模态报告自动化生成part1-数据获取
  • vLLM 的“投机取巧”:Speculative Decoding 如何加速大语言模型推理
  • 重生之我在暑假学习微服务第二天《MybatisPlus-下篇》
  • 【前端】【vscode】【.vscode/settings.json】为单个项目配置自动格式化和开发环境
  • 人工智能——图像梯度处理、边缘检测、绘制图像轮廓、凸包特征检测