当前位置：首页 > news >正文

《Resolving tissue complexity by multimodal spatial omics modeling with MISO》

news 2025/8/10 13:00:16

概念

多模态空间组学：简单来说，就是同时研究生物组织里的多种分子信息（比如基因表达、蛋白质、代谢物、表观遗传标记等），而且这些信息还带有空间位置。

MISO（MultI-modal Spatial Omics）是这篇论文提出的一种算法，专门用来分析这些复杂的多模态空间组学数据。它的目标是把不同类型的数据（比如基因表达和组织切片的显微镜图像）整合起来，找出组织里不同的功能区域（叫“空间域”），而且还能处理超大规模的数据，比如亚细胞级别的精细数据。

MISO算法的工作流程

MISO的工作流程（图1）包括以下关键步骤：

2.构建模态特异性邻接矩阵，捕捉数据点之间的相似性，利用神经网络（SpectralNet启发）生成低维特征向量。

3.对于组织学成像（如H&E染色图像），使用预训练的层次视觉变换器（ViT）模型提取局部和全局特征，生成每个点的576维嵌入。

对于组织学图像，MISO用一个预训练的视觉变换器（ViT）模型，分析图像的局部和全局特征。比如，它会看一个细胞附近的小区域（局部特征），同时也考虑整个组织切片的模式（全局特征），最后给每个数据点生成一个576维的图像特征向量。

特征提取（”精华提取“）：
- 对每种模态使用特定的多层感知器（MLP（一种神经网络））提取低维嵌入，基于光谱聚类和重构损失函数进行训练。
“多层感知器”（MLP）的神经网络，把高维数据（比如几千个基因的表达量）压缩成低维的“特征向量”，有点像把一大堆信息提炼成一个简洁的“摘要”。
“光谱聚类”该方法，基于数据点之间的相似性（通过“邻接矩阵”表示），确保提取的特征能捕捉数据的内在结构。
跨模态特征融合（”混出新味道“）：
- 计算模态对之间的外积（”外积“一种数学操作），生成交互特征矩阵，捕捉模态间的相互作用（如基因表达与表观遗传数据的调控关系）。
为什么还要计算模态对？因为光有单独的特征还不够，MISO还会看不同模态之间的“互动”。比如，基因表达和染色质开放性（ATAC-seq）可能一起决定某个细胞的功能。
2.通过主成分分析（PCA）将交互特征降维至32维，与模态特异性特征保持一致。然后和单独模态的特征拼接在一起，形成一个包含所有信息的“综合特征”。
低质量模态过滤（”丢掉烂食材“）：
- 用户需通过视觉检查（图像模态）或定量指标（如基因表达的UMI计数、代谢物信号的空间分布）识别低质量模态，并决定是否纳入聚类。
某些数据质量不好，比如图像有模糊或染色不均，基因数据测序深度不够，通过检查将低质量的特征剔除，只保留高质量的特征和它们的交互特征。
K均值聚类（”分菜，装盘“）：
- 将模态特异性和交互特征向量拼接后，输入K均值聚类算法，生成反映生物学特性的空间域。每个域代表一个生物学上独特的功能区域，比如肿瘤区域、免疫细胞聚集区等。
大规模数据集优化：
- 对于大规模数据集（如MERFISH生成的数据），MISO通过稀疏邻接矩阵（基于k近邻，k=100）降低存储需求，提高计算效率。

MISO的计算效率突出，可在单GPU上处理中等规模数据集（1,000-10,000个点）在1分钟内完成，并能扩展至包含数十万点的超大规模数据集。

应用案例与结果

文章通过16个数据集（涵盖小鼠、人类、斑马鱼的多种组织和模态）展示了MISO的性能，以下是主要应用案例的总结：

膀胱癌10x Visium V2数据（利用istar工具识别微米级案例）（图2）
总结：MISO像个“显微镜”，能从复杂的数据里精准挖出细小的HEV结构，其他方法要么太“粗糙”，要么直接“看不见”。
- 数据集：转录组+组织学成像（H&E），使用iStar增强分辨率至4×4 µm²超像素。
- 目标：识别三级淋巴结构（TLS）中的高内皮小静脉（HEV）。
- 结果：MISO精确识别TLS1和TLS2中的HEV（误分非HEV超像素仅10个和6个），灵敏度和特异性均高于SpatialGlue（误分289和381个）和MUSE（无法生成HEV相关聚类）。
- 评估：通过类内相关系数（ICC）比较，MISO在RNA和组织学数据的聚类一致性上优于其他方法。
胃癌10x Xenium数据（数据庞大的案例）（图3a-e）
- 数据集：单细胞分辨率转录组（377个基因，696,314个细胞）+组织学成像。
- 目标：区分病理学家标注的组织结构（如低黏附性癌、侵袭性分散肿瘤细胞、淋巴聚集等）。
- 结果：MISO准确区分低黏附性癌（聚类14）和分散肿瘤细胞（聚类5），并识别小规模淋巴聚集，减少手动标注时间。MISO利用组织学特征成功区分表达相似标记基因（如ERBB2）的癌和黏膜区域。
- 优势：由于内存限制，MUSE和SpatialGlue无法处理此大规模数据集，而MISO展现了处理能力。

总结：MISO像个“超级大脑”，在数据量大、基因信息少的情况下，依然能精准找到复杂的组织结构，而其他方法直接“卡壳”了。

3.结直肠癌10x Visium HD数据（展示MISO处理亚细胞分辨率和全转录组数据的超强能力）（图3f-i）

1.数据集：亚细胞分辨率全转录组（18,085个基因，545,913个8×8 µm²区域）+组织学成像。

2.目标：区分肌肉、正常结肠黏膜和侵袭性癌。

3.结果：MISO识别侵袭性癌的多个子类，其中聚类4与SPP1+巨噬细胞共定位，提示更具侵袭性的肿瘤细胞（SPP1在聚类4中上调，log2倍变化1.06，P=1.22×10⁻⁵⁶）。

4.优势：MISO通过提取组织学特征，捕捉短程和远程依赖，优于MUSE和SpatialGlue（后者因内存限制无法分析）。

总结：MISO可以找到癌区，同时进一步将癌区分成几个子类，并与SPP1+巨噬细胞共定位，从而找到更侵袭性的癌细胞亚型。

4.小鼠胚胎（E13）空间ATAC-RNA-seq数据（涉及两种复杂的模态（转录组和表观遗传组））（图4）

1.数据集：转录组+染色质可及性+组织学成像，聚焦前脑端脑区域。

2.目标：区分端脑的脑室区（VZ）、底板层和皮质层。

3.结果：MISO唯一区分了VZ（SOX2高表达，聚类3）、底板层（GAD2高表达，聚类1）和皮质层（TBR1高表达，聚类6），验证了其整合复杂模态的能力。t-SNE分析显示MISO聚类在RNA和ATAC模态上分离度高，优于MUSE和SpatialGlue。

总结：MISO能整合RNA、ATAC和图像三种模态，捕捉复杂的空间和分子关系。

5.小鼠海马空间转录组与代谢组数据（支持三模态整合）（图5a-c）

数据集：转录组+代谢组（MALDI-MSI）+组织学成像，增强分辨率后对齐空间坐标。
目标：细分海马锥体层（CA1sp、CA2sp、CA3sp）。
结果：MISO准确区分CA1sp、CA2sp和CA3sp（包括CA3的三个子区域），而MUSE和SpatialGlue仅区分CA1sp和CA3sp。MERFISH数据验证了MISO在CA2sp/CA3sp边界的精确性。

总结：MISO像个“精密雕刻师”，能把海马的细微结构雕得清清楚楚，其他方法只能看到“大轮廓”。

MISO能整合三种模态（转录组、代谢组、图像），捕捉更细致的结构。

6.人类扁桃体空间基因与蛋白表达数据（展示了MISO处理三种模态（转录组、蛋白质组、组织图像）的能力）（图5d-h）

数据集：转录组+蛋白质组（35个蛋白）+组织学成像。
目标：定位生发中心。
结果：MISO在所有模态组合下的F1分数最高（0.90，三模态；0.86-0.88，双模态），优于MUSE（最高0.87）和SpatialGlue（最高0.83）。

总结：MISO能处理三种模态（转录组、蛋白质组、组织图像）的能力，尤其是在免疫组织中定位关键结构。MISO像个“免疫系统GPS”，能精准导航到生发中心这个“免疫大本营”，而其他方法可能会“迷路”。

其他应用（扩展数据图2-10，补充图2-5）

1. 小鼠前脑空间转录组数据（扩展数据图2）

数据集：10x Visium小鼠前脑（前部冠状切片），包含转录组和H&E图像。
目标：根据Allen Brain Atlas的标注，区分前脑的皮质层和其他结构。
MISO的表现：
- MISO的聚类结果与Allen Brain Atlas的皮质层标注高度一致，准确区分了不同脑区（图2b）。
- 它的ICC（类内相关系数）在RNA和图像模态上都高于MUSE和SpatialGlue（图2c），说明聚类更一致。
- 即使图像有伪影（图2e），MISO依然通过RNA和交互特征保持了高精度。
对比：SpatialGlue对模态权重敏感，调整权重后结果不稳定（图2b）；MUSE受图像伪影影响，聚类质量较低。
意义：MISO像个“脑区规划师”，能在图像质量不完美时，依然精准划分大脑区域，对研究脑功能和疾病（如癫痫）很有用。

2. 人类乳腺癌空间转录组数据（扩展数据图3）

数据集：10x Visium人类乳腺癌数据，包含转录组和H&E图像，病理学家标注了原位癌（DCIS）、侵袭性癌和脂肪区域。
目标：区分这些组织区域，找出侵袭性癌的子类。
MISO的表现：
- MISO的聚类与病理学标注高度吻合（图3b），甚至在侵袭性癌区域找到一个子类，UMI计数明显低于其他子类（图3e），可能反映癌细胞的异质性。
- t-SNE图（图3d）显示MISO的聚类与基因表达模式一致，ICC也高于MUSE和SpatialGlue（图3c）。
- SpatialGlue对图像权重敏感，调整权重后仍无法识别脂肪区域（图3f）。
意义：MISO像个“癌症地图绘制者”，能找到癌细胞的细微差异，帮医生判断肿瘤的侵袭性，指导治疗。

3. 斑马鱼黑色素瘤空间转录组数据（扩展数据图4）

数据集：10x Visium斑马鱼黑色素瘤数据，包含转录组和H&E图像，但图像有模糊伪影（图4a）。
目标：在图像质量低的情况下，区分肿瘤和周围组织。
MISO的表现：
- MISO识别出图像质量低，剔除了图像特异性特征，只用RNA和RNA×图像交互特征，依然得到高质量聚类（图4b）。
- MUSE受模糊伪影影响，聚类被图像质量“带偏”；SpatialGlue表现稍好但仍不如MISO（图4c）。
意义：MISO像个“抗干扰侦探”，即使图像模糊，也能从基因数据里挖出真相，适合处理实验中常见的数据质量问题。

4. 小鼠嗅球空间转录组数据（扩展数据图5）

数据集：10x Visium小鼠嗅球数据，包含转录组和H&E图像，标注了嗅球的层次结构。
目标：区分嗅球的各层（如颗粒细胞层、外丛状层）。
MISO的表现：
- MISO的聚类与嗅球层次标注完美匹配（图5a-b），ICC高于MUSE和SpatialGlue（图5c）。
- MUSE把嗅球分成上下两部分，没能细化层次；SpatialGlue稍好但仍不如MISO。
意义：MISO像个“嗅觉解剖师”，能精准划分嗅球的结构，对研究嗅觉处理和神经退行性疾病（如帕金森）有帮助。

5. 人类乳腺癌空间基因与蛋白表达数据（扩展数据图8）

数据集：10x Visium人类乳腺癌数据，包含转录组、蛋白质组（3通道免疫荧光：DAPI、Vimentin、PCNA）和H&E图像。
目标：整合三种模态，区分组织结构。
MISO的表现：
- MISO在所有模态组合（RNA+图像、RNA+蛋白、蛋白+图像、或三者一起）下都得到高质量聚类（图8a-d）。
- ICC显示MISO在RNA、蛋白和图像模态上的聚类一致性最高（图8f），比MUSE和SpatialGlue强。
意义：MISO像个“多才多艺的艺术家”，能用多种“颜料”（模态）画出组织的细致图像，适合研究复杂癌症微环境。

6. 小鼠脑空间转录组与代谢组数据（扩展数据图9-10，补充图5）

数据集：10x Visium和MALDI-MSI生成的小鼠脑冠状切片数据，包含转录组、代谢组和H&E图像。RNA质量低（图9e），数据量大（扩展数据图10用299,350个16×16像素伪点）。
目标：区分脑区（如海马、皮质），处理低质量RNA和大数据。
MISO的表现：
- MISO剔除了低质量RNA特异性特征，只用RNA×代谢组和RNA×图像交互特征，依然准确区分脑区（图9a-d，图10a-d）。
- 在超大数据集（299,350个伪点）上，只有MISO能运行，MUSE和SpatialGlue因内存限制失败（图10f）。
意义：MISO像个“大数据处理机”，能在数据质量差、量大的情况下，依然挖出脑区的生物学结构，适合高通量组学研究。

7. 小鼠冠状脑空间CUT&Tag-RNA-seq数据（补充图3-4）

数据集：包含转录组和表观遗传标记（H3K27AC、H3K27ME3）的CUT&Tag数据，以及H&E图像。
目标：区分脑区，验证MISO在表观遗传数据上的表现。
MISO的表现：
- MISO准确区分了脑区的功能区域，ICC高于MUSE和SpatialGlue，展现了整合表观遗传和转录组的能力。
意义：MISO像个“表观遗传解码器”，能揭示基因调控和表达的空间关系，对研究脑发育和疾病（如癫痫）有帮助。

MISO的优点与局限性

优点：

多模态整合：支持任意数量的模态（转录组、蛋白质组、表观遗传组、代谢组、组织学成像等）。
计算效率：快速处理中小规模数据集，稀疏矩阵优化支持大规模数据。MISO能在1分钟内处理1,000-10,000个点的数据集，用稀疏矩阵还能搞定几十万个点的大数据集。例如胃癌的那个Xenium数据集（69.6万个细胞）
鲁棒性：通过过滤低质量模态和最小化超参数调整，适应真实世界中的数据挑战。MISO能处理低质量数据，比如模糊的图像或低UMI计数的基因数据。它让用户决定是否剔除低质量模态，还通过交互特征保留部分信息。
高精度：在多种生物学结构识别中优于MUSE和SpatialGlue，尤其在细粒度结构（如HEV、CA2sp）上表现突出。

局限性：

图像模态限制（仅H&E）：目前仅支持H&E染色图像的特征提取，不适用于其他成像类型（如三色法、免疫荧光、DAPI）。
无监督性：需用户解释聚类结果与生物学结构的关联。比如“这个聚类对应的是肿瘤还是正常组织？”这可能需要病理学家的专业知识。
模态贡献评估：无法直接量化各模态对聚类的贡献或自动检测低质量模态，需用户手动评估。

跟其他方法的对比

MUSE：擅长转录组+图像，但不支持代谢组或蛋白质组，内存需求高，处理大数据时容易“翻车”。
SpatialGlue：能处理两个组学模态，但不支持图像，超参数调整麻烦，对低质量模态敏感。
MISO：综合能力最强，支持多模态，超参数少，内存优化好，适合大数据和复杂场景。

MISO如何处理H&E图像特征

H&E图像（组织学切片染色图像）是空间组学的重要模态，提供了组织的空间结构信息。MISO的图像特征提取过程很聪明，像是把一张复杂的“组织画”拆解成数字化的“特征拼图”。具体步骤如下（论文第10页，补充图6有详细示意图）：

用层次视觉变换器（ViT）模型：
- MISO用了一个预训练的‘’Hierarchical Image Pyramid Transformer (HIPT)‘’模型，训练过10,000多张全景切片图像，能捕捉组织的局部和全局特征。
- 比喻：这就像一个“超级画师”，既能看清画上的小细节（细胞形态），也能把握整幅画的布局（组织结构）。
分层提取特征：
- 局部特征：HIPT把大图像切成256×256像素的小块，每个小块用一个局部ViT模型处理，生成一个384维的“补丁嵌入”（patch embedding），描述小块的细节。
- 全局特征：把这些256×256小块的特征（CLS token，192维）输入一个全局ViT模型，分析它们在更大区域（4096×4096像素）里的关系，生成捕捉远程依赖的特征。
- 每个16×16像素的小补丁最终得到一个576维嵌入（384维局部+192维全局）。
生成点级特征：

空间组学数据点（比如Visium的55微米点或Xenium的单细胞）通常覆盖多个16×16像素补丁。MISO把一个数据点覆盖的所有补丁的576维嵌入取平均，生成这个点的图像特征。

这就像把一张画上的每个区域（数据点）用“颜色、纹理、结构”的综合描述概括出来。

为什么这很重要？