当前位置: 首页 > news >正文

论文阅读:H-ViT,一种用于医学图像配准的层级化ViT

来自CVPR的一篇文章,用CNN+Transformer混合模型做图像配准。可变形图像配准是一种在相同视场内比较或整合单模态或多模态视觉数据的技术,它旨在找到两幅图像之间的非线性映射关系。

1,模型结构

首先,使用类似特征金字塔网络(FPN)的CNN作为主干网络,用于从输入图像中提取多尺度的特征图。顶层的Sh个CNN特征被用来生成Transformer特征。这些特征首先会被映射成通道数量为fe,然后做embedding。然后输入双注意力模块。双注意力模块会生成变形场,最后网格采样器根据变形场生成目标图像。

2,双注意力模块

双注意力模块由自注意力和交叉注意力组成,

如图展示了双注意力模块在不同尺度上应用自注意力和交叉注意力的过程。交叉注意力和自注意力都是QKV结构。

其中第一部分是自注意力,QKV均来自同一尺度特征。下面两个部分是交叉注意力,Q和KV来自不同尺度的特征。

3,损失函数

本文模型使用的损失函数包含两个部分:相似性损失和平滑性损失。

相似性损失的公式如下:

平滑性损失的作用是为了防止产生不连续的变形场,公式如下:

平滑性损失计算的是变形场的空间梯度的L2范数,这样可以更强烈地惩罚那些梯度较大的区域。

整体损失函数公式如下:

其中λ是预定义的系数。

4,变形场和网格采样器

4.1 变形场

变形场(Deformation Field)是图像配准中的一个重要概念,是一个从移动图像(源图像)到目标图像的映射。它定义了移动图像中每个点在目标图像空间中的新位置。数学上,变形场可以表示为一个向量场,其中每个向量指向源图像中相应点在目标图像中的位置偏移。

4.2网格采样器

它的作用是根据一个给定的变形场来重新采样图像的像素网格,从而实现图像的变形或映射。变形场通常是一个向量场,网格采样器根据变形场中的向量,计算出原始图像中每个像素点的新位置。如果新位置是子像素位置,则需要使用插值方法来计算这个新位置的像素值。

5,实验

5.1 使用的度量

为了量化模型的性能,使用了多种度量标准,如Dice分数、HD95、SDlogJ等。

其中,HD95:是Hausdorff距离的95%分位数,意味着在95%的情况下,配准误差不会超过这个值。这是一种衡量两组几何对象之间相似度的方法,常用于评估图像配准算法的性能。Hausdorff距离是度量两个点集A和B之间最大距离的度量。计算公式为:H(A,B) = max(h(A,B), h(B,A)),其中h(A,B)表示集合A中的点到集合B中最近点的最大距离,h(B,A)表示集合B中的点到集合A中最近点的最大距离。

SDlogJ:Standard Deviation of the Logarithm of the Jacobian Determinant,是一个统计量,用于度量变形场中雅可比行列式对数值的标准差。雅可比行列式描述了一个点从一个坐标系统映射到另一个坐标系统时体积变化的比率。简单来说,它反映了变换过程中局部体积的膨胀或收缩情况。由于雅可比行列式值可能非常大或非常小,为了方便数学处理和比较,通常会取其对数值。这样做可以使得数据更加平稳。

5.2 实验结果

实验使用了五个公开可用的T1 MRI数据库,包括OASIS、IXI、ADNI、LPBA和Mindboggle。对比了VoxelMorph、MIDIR、CycleMorph、ViT-V-Net和TransMorph等基准方法。实验表格比较多那就不贴了,总之就是超越了这些方法。

http://www.lryc.cn/news/371486.html

相关文章:

  • 【MySQL】(基础篇七) —— 通配符和正则表达式
  • HTML静态网页成品作业(HTML+CSS)—— 名人霍金介绍网页(6个页面)
  • MySQL: 索引与事务
  • 2024年最新Microsoft Edge关闭自动更新的方法分享
  • Unity3D TextMeshPro组件使用及优化详解
  • react 0至1 【jsx】
  • 算法训练营day58
  • JAVA面试中,面试官最爱问的问题。
  • 【机器学习300问】115、对比K近邻(KNN)分类算法与逻辑回归分类算法的差异与特性?
  • Selenium IDE 工具
  • python的open函数
  • 德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第六周) - 预训练模型
  • 【Redis】Redis常见问题——缓存更新/内存淘汰机制/缓存一致性
  • 【redis】redis事务
  • 编程入门费用:揭开学习成本的神秘面纱
  • js/javascript获取时间戳的5种方法
  • window系统下为django自动绘制模型类关系图
  • Redis的数据淘汰策略和集群部署
  • 解决CentOS 7无法识别ntfs的问题
  • 排名前五的 Android 数据恢复软件
  • Java 程序结构 -- Java 语言的变量、方法、运算符与注释
  • 淘宝/天猫商品详情优惠券获取API 接口
  • Vue前端ffmpeg压缩视频再上传(全网唯一公开真正实现)
  • 样式的双向绑定的2种方式,实现样式交互效果
  • 供应链经理面试题
  • 快速理解 Node.js 版本差异:3 分钟指南
  • 【Qt实现录频】
  • Golang编译导致的代码错觉
  • SpringBoot整合H2数据库并将其打包成jar包、转换成exe文件
  • web前端文本大小:从入门到精通的全方位解析