当前位置：首页 > article >正文

图像分割（1）U-net

article 2025/9/16 18:31:32

一、整体结构

虽然说是几年前的产品，但是现在还在用，因为深度学习很多时候越是简单的网络用起来效果越好，而且一般是目标比较小的时候产生的分割问题。u-net的优势就是网络结构简单，适合小目标分割，所以一直用到现在，在此基础上进行升级。

概述就是编码解码过程，如上图所示，我们可以把每一步当做一层，比如这样：

现在比如有一张图片的数据，首先使用卷积层提取特征，把输入数据x到网络中，走几个卷积层，然后越来越扁越来越矮，左边的一半就是编码。假设输入是64*64，那么输出大小也是64*64，大小得一直，虽然上图不同，但在后续改进中是相同的。那么在左边降采样之后我们想得到相同大小的输出，我们就得上采样回去，也就是解码层。

总体来说就是编码再解码。

那么中间从左向右的灰色箭头是干嘛的呢，我们现在深度学习做任何任务的时候都强调特征融合，那么比如第一层表示浅层特征，那么往后就是更高层的特征，我们可以通过加法来融合，也可以通过拼接融合，也就是首尾拼接，现在来说使用拼接的效果更好，虽然维度更高，但是也是可以用降采样，相比于直接加法来说有加权。

二、U-net++

如图所示，下采样卷积步长为2，那么每次减少一半，升采样反之；对于上图的特征融合，比如拿X0,0和X1,0融合得到X0,1，不光如此，每一个都这样去融合，对于X0,2来说，不光和X0,1 1,1融合，还和X0,0融合，也就是跟前面所有的都进行拼接，这就是U-net++的结构。

U-net++ 在编码器与解码器之间构建了多级嵌套的子网络，通过密集的跳跃连接逐步融合不同层次的特征，减少了语义差距。

嵌套子网络：每个解码层通过密集连接与所有更浅的编码层相连，形成类似“网格”的结构。
桥接模块：跳跃连接中插入卷积块（Conv+BN+ReLU），对特征进行细化后再融合，而非直接拼接。

U-net++的优点：

如果训练模型觉得不用最后一层也能很好，那么就算剪枝也是完整的模型。

三、U-net+++（了解）

http://www.lryc.cn/news/2379077.html

相关文章：

数位和：从定义到编程实现

2025抓包工具Reqable手机抓包HTTPS亲测简单好用-快速跑通

使用 Auto-Keras 进行自动化机器学习

python 自动化教程

简单使用Slidev和PPTist

RISC-V 开发板 MUSE Pi Pro V2D图像加速器测试，踩坑介绍

人工智能100问☞第26问：什么是贝叶斯网络？

c++多线程debug

如何畅通需求收集渠道，获取用户反馈？

标准库、HAl库和LL库（PC13初始化）

LangGraph深度解析：构建持久化、可观测的智能体工作流

设备预测性维护的停机时间革命：中讯烛龙如何用AI重构工业设备管理范式

day29 python深入探索类装饰器

Python数据分析三剑客：NumPy、Pandas与Matplotlib安装指南与实战入门

二：操作系统之进程控制块（PCB）

Spring-Beans的生命周期的介绍

Android 自定义悬浮拖动吸附按钮

通过串口设备的VID PID动态获取串口号（C# C++）

[创业之路-361]：企业战略管理案例分析-2-战略制定-使命、愿景、价值观的失败案例

Window远程连接Linux桌面版

一种开源的高斯泼溅实现库——gsplat: An Open-Source Library for Gaussian Splatting

ARM A64 STR指令

C#中的成员常量：编译时的静态魔法

Linux wlan 单频段 dual wifi创建

HOW - React NextJS 的同构机制

c#队列及其操作

【CSS】使用 CSS 绘制三角形

信奥赛-刷题笔记-栈篇-T2-P3056括号调整问题0518

生命之树--树形dp

inverse-design-of-grating-coupler-3d