2025.7.25论文阅读
论文阅读
Single Modality vs. Multimodality: What Works Best for Lung Cancer Screening? 解释了多模态传感器数据融合优势大于单一模态输入 里面介绍了多模态数据融合三种方法 其中全中间融合(Full Intermediate Fusion, FIF)方法效果最好
评价指标:
ROC曲线下面积(Area Under the ROC Curve, AUC)
AUC是一种广泛用于评估二分类模型性能的指标。它的值介于0到1之间,其中:
1:表示模型是完美的分类器,能够完全区分正类和负类。
0.5:表示模型性能与随机猜测相当,没有区分能力。
小于0.5:表示模型性能比随机猜测还要差。
AUC的优势在于:
对类别不平衡不敏感:在数据集中正负样本数量不均衡的情况下,AUC比准确率(Accuracy)等指标更能反映模型的真实性能。
独立于分类阈值:AUC评估的是模型在所有可能分类阈值下的表现,而不是依赖于某个特定的阈值。这意味着它能更全面地衡量模型的排序能力,即模型将正样本排在负样本之前的能力。
存在的问题:
1. 数据集来源:研究使用的是国家肺癌筛查试验(NLST)数据集。虽然这是一个大型数据集,但其数据特点(例如,参与者年龄、吸烟史等)可能限制了模型在其他人群或不同筛查背景下的泛化能力。
2.影像数据处理:CT扫描来自不同的设备和扫描协议,导致切片厚度和像素间距的差异。尽管进行了重采样和归一化处理以确保同质性,但这仍然可能引入一些信息损失或偏差。
3.结节ROI的获取方式:数据集中不提供已识别结节的分割掩膜,而是手动创建了包含结节的20 × 50 × 50边界框。这种手动创建可能引入主观性或误差,并且可能没有充分捕捉结节的完整形态信息。
4.临床特征选择:尽管从原始的324个特征中筛选出136个特征,并进一步缩小到42个特征,但特征选择过程可能存在主观性,并且可能没有包含所有对肺癌预测有用的临床信息。
5.单一病理关注:研究主要关注肺癌的预测,而肺癌本身是一种复杂的疾病,受多种生物和生理现象以及多种因素影响。模型可能未能完全捕捉所有这些复杂性