当前位置: 首页 > news >正文

DeSD:用于3D医学图像分割的深度自蒸馏自监督学习

文章目录

  • DeSD: Self-Supervised Learning with Deep Self-Distillation for 3D Medical Image Segmentation
    • 摘要
    • 本文方法
      • Deep Self-Distillation
      • Downstream Transfer Learning
    • 实验结果

DeSD: Self-Supervised Learning with Deep Self-Distillation for 3D Medical Image Segmentation

摘要

背景
在这里插入图片描述

自监督学习(SSL)能够在几乎没有注释的情况下实现高级性能,已被证明在医学图像分割中是成功的。通常,SSL依赖于测量在最深层获得的特征的相似性来吸引正对的特征或排斥负对的特征,然后可能遭受浅层的弱监督。
本文方法

  1. 以深度自蒸馏(DeSD)的方式重新制定了SSL,以提高浅层和深层的表示质量。
  2. DeSD模型由在线学生网络和动量教师网络组成,两者都由多个子编码器堆叠。对学生网络中的每个子编码器产生的特征进行训练,以匹配教师网络产生的特征。这样的深度自蒸馏监督能够提高所有子编码器的表示质量,包括浅编码器和深编码器。我们在大规模未标记数据集上预训练DeSD模型,并在七个下游分割任务上对其进行评估。我们的结果表明,与现有的SSL方法相比,所提出的DeSD模型实现了卓越的预训练性能,创下了新的技术水平
    代码地址

本文方法

在这里插入图片描述
两种类型的SSL方法。(a) 单次自蒸馏学习:从学生编码器获得的输出分布被训练为与从教师编码器获得的相匹配。(b) 建议的深度自蒸馏学习(DeSD):将学生编码器解耦为四个子编码器,每个子编码器执行单个自蒸馏学习
我们的DeSD方法遵循两步SSL范式,即自监督表示学习和完全监督的下游微调。DeSD包含一个在线编码器和一个动量编码器(见图2)。在线编码器进一步分为四个子编码器,这四个子编码器产生多个中间表示。

Deep Self-Distillation

DeSD是基于自蒸馏SSL范式实现的,包括在线学生编码器和动量教师编码器。学生编码器被解耦为四个子部分,分别表示为:两个编码器共享相同的网络架构,而教师网络的参数被公式化为学生网络的动量版本。本研究采用了强大的数据转换,包括翻转、缩放、高斯噪声、高斯模糊、图像亮度和图像对比度,以生成两个视图I1和I2作为Siamese网络的输入

在每次迭代期间,I1和I2依次通过四个子编码器,然后通过全局平均池化将这些子编码器的每个输出特征转换为特征向量。随后,每个子编码器之后是多层感知器(MLP)投影仪(具有四层)和softmax函数,以将特征向量投影到高维潜在空间。前两个MLP层中的每个层都有2048个神经元,随后是批量归一化(BN)和高斯误差线性单元(GELU)激活。瓶颈层有256个没有BN和GELU的神经元。最后一层MLP将神经元数量增加到K,并采用权重归一化来加速训练。与此同时,I2和I1通过动量教师编码器,获得的特征向量被馈送到MLP投影仪,随后是居中和锐化操作以及softmax函数。该输出被视为由在线编码器中的四个子编码器产生的那些目标向量的监督信号。损失函数基于对称交叉熵损失,如下所示
在这里插入图片描述
其中Du是一个大规模的未标记数据集,f表示生成输出向量的前馈过程,而<.>是此过程中使用的一组参数。注意,为了简单起见,MLP参数在该方程中被忽略。
上述损失函数仅用于更新在线编码器。采用以下指数移动平均(EMA)策略在每次迭代中更新动量编码器
在这里插入图片描述
其中,m是动量系数,该动量系数被初始化为0.996,并根据余弦表逐渐增加到1

Downstream Transfer Learning

为了使DeSD预训练的动量编码器适应下游分割任务,我们在其末尾堆叠了一个基于CNN的解码器。解码器参数是随机初始化的。该分割网络以有监督的方式进行训练,以最小化Dice损失和二进制交叉熵损失之和

实验结果

在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/67616.html

相关文章:

  • MySQL数据库——MySQL创建触发器(CREATE TRIGGER)
  • Java实现网上人才招聘系统【附源码】
  • jmeter接口测试项目实战详解,零基础也能学,源码框架都给你
  • MySQL中去重 distinct 和 group by 是如何去重的
  • 在职读研是理想还是情怀?你想要的都将在社科大能源管理硕士项目实现
  • 携手共建数字钢铁,Hightopo亮相第三届钢铁展洽会
  • Leetcode2383. 赢得比赛需要的最少训练时长
  • js代码执行过程、调用栈、执行上下文
  • 互联网摸鱼日报(2023-05-12)
  • 【Python从入门到实践3.1】扑克发牌知识点(range函数,def函数,else语句配合使用,random库,列表推导式)
  • Spring Cloud第二季--Spring Cloud Bus
  • Unittest自动化测试之unittestunittest_生成测试报告
  • 一个查询IP地理信息和CDN提供商的离线终端工具
  • RflySim平台使用篇 | Rflysim3D软件使用系列教程(二)
  • 2023 年第五届河南省 CCPC 大学生程序设计竞赛
  • nginx liunx最新版本安装flask部署
  • 热图 -- pheatmap or ggplot2
  • EIScopus检索 | 2023年智能交通与未来出行国际会议(CSTFM 2023)
  • 如何系列 如何在Windows和Linux安装Nginx
  • “1+X+N”模式助力企业数字化转型
  • JavaEE(系列3) -- 多线程(线程的中断与线程等待)
  • 想装一台自己的电脑,可以先了解下这些问题
  • Redis未授权漏洞复现
  • 跳槽,如果没有更好的选择,可以去美团试试···
  • Java10
  • IMS call通话类型对比差异
  • 5.2 中心极限定理
  • JVM 内存分哪几个区,如和判断一个对象是否存活
  • 在Spring Boot微服务使用Jedis操作Redis List列表
  • springboot + vue 部署 阿里云云服务器 ECS