当前位置：首页 > news >正文

U-net医学分割网络——学习笔记

news 2025/9/16 17:57:16

《U-Net: Convolutional Networks for Biomedical Image Segmentation》

一、提出背景

U-Net 的提出是为了解决生物医学图像分割的几个关键问题：需要像素级的精确分割、标注数据稀缺、滑动窗口方法效率低以及多尺度特征融合的需求。U-Net 通过对称的 U 型全卷积结构，结合数据增强策略，使得在少量数据下也能实现高效、精准的图像分割。

像素级别的精确分割需求：
- 传统的卷积神经网络（CNN）多用于图像分类，将整张图像归入某个类别标签。然而，在生物医学图像处理中，常常需要对每个像素进行分类（例如细胞、组织等的分割），因此需要更精确的定位。
数据有限：
- 在生物医学图像领域，大量标注数据难以获得，手动标注需要专业知识且耗时耗力。U-Net 引入了数据增强（尤其是弹性形变等随机变换）技术，以少量标注数据训练出鲁棒性较强的网络。
滑动窗口方法的局限性：
- 早期的分割方法采用“滑动窗口”策略，对图像的每一小块进行分类。这种方法效率低，且分割精度和上下文信息之间存在权衡。U-Net 改进了这一策略，采用全卷积网络结构（Fully Convolutional Network），避免了滑动窗口的冗余计算，同时利用更多上下文信息，提高了定位精度。
多尺度特征的融合：
- 生物医学图像中，目标物体（如细胞或细胞器）具有多种尺度和形状变化。U-Net 通过对称的 U 型架构将不同分辨率下的特征相结合，使得模型既能捕获全局上下文信息，又能进行精确的局部定位。

二、网络设计

网络体系结构如上图所示。它包括一条收缩路径(左侧)和一条扩张路径(右侧)。收缩路径遵循卷积网络的典型架构。它由两个3x3卷积(未填充卷积)的重复应用组成，每个卷积后面都有一个整流线性单元(ReLU)和一个2x2 max池化操作，步幅为2，用于下采样。在每个降采样步骤中，我们将特征通道的数量加倍。扩展路径中的每一步都包括特征映射的上采样，然后进行2x2卷积(“上卷积”)，将特征通道的数量减半，与收缩路径中相应裁剪的特征映射进行连接，以及两个3x3卷积，每个卷积后面都有一个ReLU。由于在每次卷积中边界像素的损失，裁剪是必要的。在最后一层，使用1x1卷积将每个64个组件的特征向量映射到所需的类数量。这个网络总共有23个卷积层。

三、U-net的优缺点

1、U-Net的优点：

（1）高效利用少量数据：通过数据增强（如弹性变形），U-Net 在有限的标注数据下也能取得良好效果，适合生物医学图像分割中标注数据不足的情况。

（2）精确的像素级分割：U-Net 的对称结构结合了上下文信息和高分辨率特征，能够精确定位每个像素的类别，适用于需要高精度的分割任务。

（3）端到端训练：U-Net 采用全卷积架构，可以从原始输入到输出直接端到端训练，无需额外的后处理步骤，简化了模型流程。

（4）多尺度特征融合：通过特征图的跳跃连接，U-Net 可以融合不同尺度的信息，提升对小目标和边缘区域的分割效果。

（5）处理大图像的能力：通过重叠拼接策略（overlap-tile strategy），U-Net 可实现对超出显存限制的大图像的无缝分割。

2、U-Net的缺点：

（1）高内存需求：U-Net 的跳跃连接和对称结构增加了模型的参数量，训练时对显存需求较高，尤其在处理大尺寸图像时尤为明显。

（2）对边界分割不敏感：尽管 U-Net 通过加权损失函数改进边界区域的分割，但在物体边界复杂或遮挡严重的情况下，分割精度可能不足。

（3）难以适应复杂背景：U-Net 的设计主要面向生物医学图像的二值分割，对于包含复杂背景或多类别的自然场景，模型可能需要调整或改进。

（4）不适合实时任务：由于网络深度和参数量大，U-Net 在实时分割任务中的推理速度可能较慢，需进一步优化才能应用于实时需求。

总体来说，U-Net 适合需要高精度和上下文信息丰富的分割任务，尤其在数据有限的医学图像领域有很大优势，但在复杂环境和边界处理上仍有改进空间。

http://www.lryc.cn/news/470447.html

相关文章：

CIM+全场景应用，铸就智慧城市发展新篇

ts：对象数组的简单使用

当我们在微服务中使用API网关时，它是否会成为系统的瓶颈？这种潜在的瓶颈如何评估和解决？如何在微服务架构中保证高效请求流量？｜API网关｜微服务｜异步处理

微服务设计模式 - 特性标志（Feature Flags）

故障诊断 | MTF-TLSSA-DarkNet-GRU-MSA迁移学习故障识别程序（t分布+莱维飞行改进麻雀优化）

【mysql 进阶】2-1. MySQL 服务器介绍

基于Qt的多线程并行和循序运行实验Demo

机器视觉-相机、镜头、光源（总结）

第六十二周周报 HestGCL

存储期类别

开源模型应用落地-Qwen2-VL-7B-Instruct-vLLM-OpenAI API Client调用

风电叶片损伤YOLO检测数据集（猫脸码客第229期）

修改 RN 打包后生成的app-release 安装包的名称

大模型EfficientSam用于图像语义分割自动标注

一个关于@JsonIgnore的isxxx()问题

Django-cookie,session

HarmonyOS开发 - 本地持久化之实现LocalStorage支持多实例

【已解决，含泪总结】非root权限在服务器Ubuntu18.04上配置python和torch环境，代码最终成功训练（二）

Flutter鸿蒙next 刷新机制的高级使用【衍生详解】

c/c++--静态变量和静态函数（static）

Windows系统启动MongoDB报错无法连接服务器

Linux的makefile与进度条小程序实践

latex写作基础

Chromium HTML5 新的 Input 类型email对应c++

嵌入式Linux的AXI平台（platform）驱动教程

什么是Java策略模式？与Spring的完美结合

[Go实战]：HTTP请求转发

【C++单调栈贡献法】907. 子数组的最小值之和|1975

极狐GitLab 17.5 发布 20+ 与 DevSecOps 相关的功能【二】

Django 5 增删改查小练习