当前位置：首页 > news >正文

AnatoMask的分层图像编码器-解码器

news 2025/8/23 20:58:26

方法思想

在这里插入图片描述

采用多尺度编码器-解码器主干：

在编码器中，把CT图像分解成不同大小的图像块，从这些图像块中提取特征
在解码器中，重建被掩盖图像时，考虑图像块的空间关系

输入D（深度Depth）张H（高Height）*W（宽Width）的CT图像

处理CT图像的步骤解释

1. 划分图像块（Patches）

想象一下，我们有一张大的CT图像，我们把它切成了很多小块，每一块的大小是16×16×16（这里的H、W、D分别代表高度、宽度和深度）。这些小块就是我们说的“输入patch”。

2. 随机掩码

接下来，我们随机地把60%的这些小块遮盖起来，就像是用一张纸遮住了一部分小块，让它们看不见。这样做的目的是为了让模型学会从剩下的可见部分推测被遮盖部分的信息。

3. 使用STU-Net处理图像

然后，我们用一个叫做STU-Net的工具来处理这些被遮盖的小块。这个工具会把这些小块变得更小，变成四个不同的尺寸：H2 × W2 × D2，H4 × W4 × D4，H8 × W8 × D8，和H16 × W16 × D16。这就像是把一张纸片折叠起来，每次折叠都变得更小。

4. 稀疏子流形卷积

在STU-Net中，我们用一种特殊的方法来处理这些小块，叫做“稀疏子流形卷积”。这个方法可以帮助我们更好地理解图像的各个部分是如何相互关联的。

5. 分层解码器

处理完这些小块后，我们用另一个工具，叫做“分层解码器”，来把这些小块重新放大，恢复到原来的大小或者中间的大小。这个过程就像是把折叠的纸片展开。

6. 重构损失

最后，我们比较遮盖前后的图像，看看模型恢复得怎么样。我们计算一个叫做“重构损失”的东西，它告诉我们模型恢复的图像和原来的图像之间有多大的差异。如果重构损失很小，说明模型做得很好，能够从遮盖的部分推测出被遮盖的信息。

在整个过程中，我们的目标是训练一个模型，让它即使在部分信息被遮盖的情况下，也能理解和恢复整个图像的内容。这就像是一个拼图游戏，即使一些拼图片被拿走了，模型也需要能够猜出这些拼图片原来的位置和样子。

方法优势

逐步重建被掩盖的图像，有效地结合了局部和全局特征

查看全文

http://www.lryc.cn/news/475201.html

面向对象编程的核心特性：封装、继承、多态与抽象

ubuntu openmpi安装（超简单）

Python中的SQL数据库管理：SQLAlchemy教程

LeetCode --- 421周赛

简单了解前缀树/字典树（Trie树）C++代码

ubuntu安装与配置Nginx（2）

Linux环境下Mongodb部署

（九）JavaWeb后端开发——Servlet

【零售和消费品＆家居用品】家庭门窗开闭状态安全监控系统源码＆数据集全套：改进yolo11-DCNV2

【JavaScript】axios 二次封装拦截器(接口、实例、全局)

Linux_02 Linux常用软件——vi、vim

C++代码优化--要求或禁止在堆中产生对象

MybatisPlus入门(六)MybatisPlus-空值处理

钉钉内集成第三方免密登录（Vue+.Net）

【玉米叶部病害识别】Python+深度学习+人工智能+图像识别+CNN卷积神经网络算法+TensorFlow

【设计模式】如何用C++实现依赖倒置

使用onnxruntime-web 运行yolov8-nano推理

Gin框架html/vue前端使用hls.js播放/点播m3u8(hls)格式视频

HarmonyOS 私仓搭建

Mybatis学习笔记（二）

Google“Big Sleep“人工智能项目发现真实软件漏洞

npm入门教程5：package.json

docker-高级（待补图）

Qt 文件目录操作

Pandas 数据清洗