当前位置: 首页 > article >正文

图像分割(1)U-net

一、整体结构

虽然说是几年前的产品,但是现在还在用,因为深度学习很多时候越是简单的网络用起来效果越好,而且一般是目标比较小的时候产生的分割问题。u-net的优势就是网络结构简单,适合小目标分割,所以一直用到现在,在此基础上进行升级。 

概述就是编码解码过程,如上图所示,我们可以把每一步当做一层,比如这样:

现在比如有一张图片的数据,首先使用卷积层提取特征,把输入数据x到网络中,走几个卷积层,然后越来越扁越来越矮,左边的一半就是编码。假设输入是64*64,那么输出大小也是64*64,大小得一直,虽然上图不同,但在后续改进中是相同的。那么在左边降采样之后我们想得到相同大小的输出,我们就得上采样回去,也就是解码层。

总体来说就是编码再解码。

那么中间从左向右的灰色箭头是干嘛的呢,我们现在深度学习做任何任务的时候都强调特征融合,那么比如第一层表示浅层特征,那么往后就是更高层的特征,我们可以通过加法来融合,也可以通过拼接融合,也就是首尾拼接,现在来说使用拼接的效果更好,虽然维度更高,但是也是可以用降采样,相比于直接加法来说有加权。

 二、U-net++

如图所示, 下采样卷积步长为2,那么每次减少一半,升采样反之;对于上图的特征融合,比如拿X0,0和X1,0融合得到X0,1,不光如此,每一个都这样去融合,对于X0,2来说,不光和X0,1 1,1融合,还和X0,0融合,也就是跟前面所有的都进行拼接,这就是U-net++的结构。

U-net++ 在编码器与解码器之间构建了多级嵌套的子网络,通过密集的跳跃连接逐步融合不同层次的特征,减少了语义差距。

  • 嵌套子网络:每个解码层通过密集连接与所有更浅的编码层相连,形成类似“网格”的结构。

  • 桥接模块:跳跃连接中插入卷积块(Conv+BN+ReLU),对特征进行细化后再融合,而非直接拼接。

U-net++的优点:

 

 如果训练模型觉得不用最后一层也能很好,那么就算剪枝也是完整的模型。

三、U-net+++(了解)

http://www.lryc.cn/news/2379077.html

相关文章:

  • 数位和:从定义到编程实现
  • 2025抓包工具Reqable手机抓包HTTPS亲测简单好用-快速跑通
  • 使用 Auto-Keras 进行自动化机器学习
  • python 自动化教程
  • 简单使用Slidev和PPTist
  • RISC-V 开发板 MUSE Pi Pro V2D图像加速器测试,踩坑介绍
  • 人工智能100问☞第26问:什么是贝叶斯网络?
  • c++多线程debug
  • 如何畅通需求收集渠道,获取用户反馈?
  • 标准库、HAl库和LL库(PC13初始化)
  • LangGraph深度解析:构建持久化、可观测的智能体工作流
  • 设备预测性维护的停机时间革命:中讯烛龙如何用AI重构工业设备管理范式
  • day29 python深入探索类装饰器
  • Python数据分析三剑客:NumPy、Pandas与Matplotlib安装指南与实战入门
  • 二:操作系统之进程控制块(PCB)
  • Spring-Beans的生命周期的介绍
  • Android 自定义悬浮拖动吸附按钮
  • 通过串口设备的VID PID动态获取串口号(C# C++)
  • [创业之路-361]:企业战略管理案例分析-2-战略制定-使命、愿景、价值观的失败案例
  • Window远程连接Linux桌面版
  • 一种开源的高斯泼溅实现库——gsplat: An Open-Source Library for Gaussian Splatting
  • ARM A64 STR指令
  • C#中的成员常量:编译时的静态魔法
  • Linux wlan 单频段 dual wifi创建
  • HOW - React NextJS 的同构机制
  • c#队列及其操作
  • 【CSS】使用 CSS 绘制三角形
  • 信奥赛-刷题笔记-栈篇-T2-P3056括号调整问题0518
  • 生命之树--树形dp
  • inverse-design-of-grating-coupler-3d