理解贝叶斯分析中的“模型比较”部分
理解贝叶斯分析中的“模型比较”部分
在贝叶斯分析体系中,模型比较是一项至关重要的核心任务,而敏感性分析可被视作模型比较的重要分支。接下来,本文将系统地阐述模型比较的方法论,并着重探讨其与敏感性分析之间的区别与联系。
一、贝叶斯模型比较的目标与意义
- 评估先验稳健性
检验先验分布的选择对后验推断的影响,确保分析结果不依赖于特定的先验假设。
若不同先验设定下的后验结果存在显著差异,表明结果对先验假设较为敏感,此时需要考虑调整样本量或优化先验设定。 - 判断样本量充分性
小样本结合非信息性先验可能导致后验区间过宽,而信息性先验则有助于缩小区间范围。若分析结果对先验敏感,通常意味着样本量不足。 - 嵌套模型对比
针对包含 / 排除协变量等嵌套模型,可通过贝叶斯因子(BF)判断协变量的必要性。 - 非嵌套模型比较
对于具有不同分布假设(如正态分布与 t 分布)的非嵌套模型,需借助桥抽样等方法计算贝叶斯因子进行比较。
二、模型比较的关键指标
- 后验概率区间(PPI)
通过对比不同先验下的区间重叠程度,判断结果的敏感性。若区间差异明显(例如信息性先验下 PPI 较窄,非信息性先验下 PPI 较宽),则表明结果敏感性较高。 - 模型比较指标
采用贝叶斯因子(BF)、离差信息准则(DIC)、留一交叉验证准则(LOOIC)等指标,量化不同先验模型对数据的拟合优度。例如,当贝叶斯因子 BF > 100 时,通常认为有强证据支持某一模型(参考文献 2)。
三、与敏感性分析的辨析
敏感性分析主要探究不同先验设定对分析结果的影响,从本质上讲,其与模型比较目标一致,可看作是模型比较的一种特定形式。
四、用于模型比较的 R 包
- sensitivity
核心功能:专注于贝叶斯先验敏感性分析,支持可视化先验变化对后验的影响。
主要功能
针对给定的模型参数,生成不同先验(如不同均值、方差的正态分布)下的后验预测分布。
绘制 “先验 - 后验” 敏感性曲线,量化先验参数变化对后验推断的影响。 - BayesFactor
核心功能:计算贝叶斯因子,用于模型比较(如评估不同先验模型的证据强度)。
敏感性分析支持
通过bf函数定义不同先验的模型,计算贝叶斯因子以评估先验的合理性。
支持 “先验鲁棒性” 分析,例如测试先验宽度对贝叶斯因子的影响。
参考文档:BayesFactor 文档 - priorflex
核心功能:灵活构建和评估先验分布,支持先验敏感性可视化。
主要功能
生成多种先验分布(如正态分布、t 分布、均匀分布),并可视化先验与似然的交互作用。
提供prior_sensitivity()函数,分析先验参数(如浓度参数)对后验的影响。 - loo
核心功能:计算留一交叉验证信息准则(LOOIC),用于贝叶斯模型比较。
敏感性分析关联
评估不同先验模型的预测性能,若 LOOIC 差异较小,说明结果对先验不敏感。
通常需结合brms或rstanarm使用。 - mcmcplots
核心功能:可视化 MCMC 结果,支持对比不同先验模型的后验分布。
敏感性分析支持
绘制多模型后验分布叠加图、PPI 区间对比图,直观展示先验影响。
支持直接可视化brms/rjags模型对象。
在实际分析过程中,我们需要在不同条件(先验设定、分布假设、变量组合等)下构建多个模型,并对它们进行比较,从中筛选出最优模型用于最终结果报道,而与先验相关的分析部分则作为 “敏感性分析” 呈现。