当前位置: 首页 > news >正文

【PyTorch】图像分割

图像分割是什么

Image Segmentation
将图像每一个像素分类
在这里插入图片描述

图像分割分类

  1. 超像素分割:少量超像素代替大量像素,常用于图像预处理
  2. 语义分割:逐像素分类,无法区分个体
  3. 实例分割:对个体目标进行分割
  4. 全景分割:语义分割结合实例分割
    在这里插入图片描述

本文讨论的是语义分割

模型如何完成图像分割

计算机:3-d张量 → 计算机:3-d张量
图像分割由模型与人类配合完成
模型:将数据映射到特征
人类:定义特征的物理意义,解决实际问题

PyTorch-Hub

PyTorch模型库,有大量模型供开发者调用 Link

1.torch.hub.load(‘pytorch/vision’, ‘deeplabv3_resnet101’,pretrained=True)

model=torch.hub.load(github, model, *args, **kwargs)
功能:加载模型
主要参数:
- github:str, 项目名,eg:pytorch/vision,<repo_owner/repo_name[:tag_name]>
- model: str, 模型名

2.torch.hub.list(github, force_reload=False)
3.torch.hub.help(github, model, force_reload=False)

深度学习中的图像分割模型

FCN

Fully Convolutional Networks for Semantic Segmentation
在这里插入图片描述

最主要贡献:
利用全卷积完成pixelwise prediction

U-Net

U-Net: Convolutional Networks for Biomedical Image Segmentation
在这里插入图片描述

DeepLab系列

V1

Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs
在这里插入图片描述
主要特点:

  1. 孔洞卷积:借助孔洞卷积,增大感受野
  2. CRF:采用CRF进行mask后处理

V2

DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs
在这里插入图片描述
主要特点:

  1. ASPP(Atrous Spatial Pyramid Pooling):解决多尺度问题

V3

Rethinking Atrous Convolution for Semantic Image Segmentation
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

主要特点:

  1. 孔洞卷积的串行
  2. ASPP的并行

V3+

Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation
在这里插入图片描述
在这里插入图片描述
主要特点:
deeplabv3基础上机上Encoder-Decoder思想

综述

Deep Semantic Segmentation of Natural and Medical Images: A Review
在这里插入图片描述
图像分割资源:
https://github.com/shawnbit/unet-family
https://github.com/yassouali/pytorch-segmentation

Unet实现人像抠图 (Portrait Matting)

数据来源:https://github.com/PetroWu/AutoPortraitMatting

未完待续……

http://www.lryc.cn/news/450185.html

相关文章:

  • 如何快速建立自己的异地互联的远程视频监控系统,通过web浏览器可以直接查看公网上的监控视频(上)
  • 实验2思科网院项目2.7.2-packet-tracer---configure-single-area-ospfv2---实践练习
  • Nginx实战经验分享:从小白到专家的成长历程!
  • 从画质设置看游戏引擎(其一)
  • #git 问题failed to resolve head as a valid ref
  • YOLOv11,地瓜RDK X5开发板,TROS端到端140FPS!
  • Python精选200Tips:181-182
  • SpringCloud 配置 feign.hystrix.enabled: true 不生效
  • 9.24-k8s服务发布
  • UI设计师面试整理-作品集展示
  • CMU 10423 Generative AI:lec10(few-shot、提示工程、上下文学习)
  • 做数据抓取工作要如何选择ip池
  • 防止电脑电池老化,禁止usb或者ac接口调试时充电
  • 智权半导体/SmartDV力助高速发展的中国RISC-V CPU IP厂商走上高质量发展之道
  • 利用vue-capper封装一个可以函数式调用图片裁剪组件
  • 在系统开发中提升 Excel 数据导出一致性与可维护性的统一规范与最佳实践
  • SpringAOP学习
  • 智能网联汽车飞速发展,安全危机竟如影随形,如何破局?
  • Android常用C++特性之std::function
  • 人工智能与机器学习原理精解【27】
  • XXL-JOB在SpringBoot中的集成
  • 前端工程规范-3:CSS规范(Stylelint)
  • Qt系列-1.Qt安装
  • 《自控原理》最小相位系统
  • SpringBoot3脚手架
  • 【C语言软开面经】
  • YOLOv11训练自己的数据集(从代码下载到实例测试)
  • HTML粉色烟花秀
  • 从零开发操作系统
  • SigmaStudio中部分滤波器算法有效性频谱分析