当前位置: 首页 > news >正文

U-net医学分割网络——学习笔记

《U-Net: Convolutional Networks for Biomedical Image Segmentation》

一、提出背景

U-Net 的提出是为了解决生物医学图像分割的几个关键问题:需要像素级的精确分割标注数据稀缺滑动窗口方法效率低以及多尺度特征融合的需求。U-Net 通过对称的 U 型全卷积结构,结合数据增强策略,使得在少量数据下也能实现高效、精准的图像分割。

  • 像素级别的精确分割需求

    • 传统的卷积神经网络(CNN)多用于图像分类,将整张图像归入某个类别标签。然而,在生物医学图像处理中,常常需要对每个像素进行分类(例如细胞、组织等的分割),因此需要更精确的定位。
  • 数据有限

    • 在生物医学图像领域,大量标注数据难以获得,手动标注需要专业知识且耗时耗力。U-Net 引入了数据增强(尤其是弹性形变等随机变换)技术,以少量标注数据训练出鲁棒性较强的网络。
  • 滑动窗口方法的局限性

    • 早期的分割方法采用“滑动窗口”策略,对图像的每一小块进行分类。这种方法效率低,且分割精度和上下文信息之间存在权衡。U-Net 改进了这一策略,采用全卷积网络结构(Fully Convolutional Network),避免了滑动窗口的冗余计算,同时利用更多上下文信息,提高了定位精度。
  • 多尺度特征的融合

    • 生物医学图像中,目标物体(如细胞或细胞器)具有多种尺度和形状变化。U-Net 通过对称的 U 型架构将不同分辨率下的特征相结合,使得模型既能捕获全局上下文信息,又能进行精确的局部定位。

二、网络设计

网络体系结构如上图所示。它包括一条收缩路径(左侧)和一条扩张路径(右侧)。收缩路径遵循卷积网络的典型架构。它由两个3x3卷积(未填充卷积)的重复应用组成,每个卷积后面都有一个整流线性单元(ReLU)和一个2x2 max池化操作,步幅为2,用于下采样。在每个降采样步骤中,我们将特征通道的数量加倍。扩展路径中的每一步都包括特征映射的上采样,然后进行2x2卷积(“上卷积”),将特征通道的数量减半,与收缩路径中相应裁剪的特征映射进行连接,以及两个3x3卷积,每个卷积后面都有一个ReLU。由于在每次卷积中边界像素的损失,裁剪是必要的。在最后一层,使用1x1卷积将每个64个组件的特征向量映射到所需的类数量。这个网络总共有23个卷积层。

三、U-net的优缺点

1、U-Net的优点

(1)高效利用少量数据:通过数据增强(如弹性变形),U-Net 在有限的标注数据下也能取得良好效果,适合生物医学图像分割中标注数据不足的情况。

(2)精确的像素级分割:U-Net 的对称结构结合了上下文信息和高分辨率特征,能够精确定位每个像素的类别,适用于需要高精度的分割任务。

(3)端到端训练:U-Net 采用全卷积架构,可以从原始输入到输出直接端到端训练,无需额外的后处理步骤,简化了模型流程。

(4)多尺度特征融合:通过特征图的跳跃连接,U-Net 可以融合不同尺度的信息,提升对小目标和边缘区域的分割效果。

(5)处理大图像的能力:通过重叠拼接策略(overlap-tile strategy),U-Net 可实现对超出显存限制的大图像的无缝分割。

2、U-Net的缺点

(1)高内存需求:U-Net 的跳跃连接和对称结构增加了模型的参数量,训练时对显存需求较高,尤其在处理大尺寸图像时尤为明显。

(2)对边界分割不敏感:尽管 U-Net 通过加权损失函数改进边界区域的分割,但在物体边界复杂或遮挡严重的情况下,分割精度可能不足。

(3)难以适应复杂背景:U-Net 的设计主要面向生物医学图像的二值分割,对于包含复杂背景或多类别的自然场景,模型可能需要调整或改进。

(4)不适合实时任务:由于网络深度和参数量大,U-Net 在实时分割任务中的推理速度可能较慢,需进一步优化才能应用于实时需求。

总体来说,U-Net 适合需要高精度和上下文信息丰富的分割任务,尤其在数据有限的医学图像领域有很大优势,但在复杂环境和边界处理上仍有改进空间。

http://www.lryc.cn/news/470447.html

相关文章:

  • CIM+全场景应用,铸就智慧城市发展新篇
  • ts:对象数组的简单使用
  • 当我们在微服务中使用API网关时,它是否会成为系统的瓶颈?这种潜在的瓶颈如何评估和解决?如何在微服务架构中保证高效请求流量?|API网关|微服务|异步处理
  • 微服务设计模式 - 特性标志(Feature Flags)
  • 故障诊断 | MTF-TLSSA-DarkNet-GRU-MSA迁移学习故障识别程序(t分布+莱维飞行改进麻雀优化)
  • 【mysql 进阶】2-1. MySQL 服务器介绍
  • 基于Qt的多线程并行和循序运行实验Demo
  • 机器视觉-相机、镜头、光源(总结)
  • 第六十二周周报 HestGCL
  • 存储期类别
  • 开源模型应用落地-Qwen2-VL-7B-Instruct-vLLM-OpenAI API Client调用
  • 风电叶片损伤YOLO检测数据集(猫脸码客第229期)
  • 修改 RN 打包后生成的app-release 安装包的名称
  • 大模型EfficientSam用于图像语义分割自动标注
  • 一个关于@JsonIgnore的isxxx()问题
  • Django-cookie,session
  • HarmonyOS开发 - 本地持久化之实现LocalStorage支持多实例
  • 【已解决,含泪总结】非root权限在服务器Ubuntu18.04上配置python和torch环境,代码最终成功训练(二)
  • Flutter鸿蒙next 刷新机制的高级使用【衍生详解】
  • c/c++--静态变量和静态函数(static)
  • Windows系统启动MongoDB报错无法连接服务器
  • Linux的makefile与进度条小程序实践
  • latex写作基础
  • Chromium HTML5 新的 Input 类型email对应c++
  • 嵌入式Linux的AXI平台(platform)驱动教程
  • 什么是Java策略模式?与Spring的完美结合
  • [Go实战]:HTTP请求转发
  • 【C++单调栈 贡献法】907. 子数组的最小值之和|1975
  • 极狐GitLab 17.5 发布 20+ 与 DevSecOps 相关的功能【二】
  • Django 5 增删改查 小练习