中介效应分析 原理解释 实例分析
中介分析导读目录
- 原理
- 模型介绍
- 传统方法 因果步骤法
- 要显著的路径有哪些?
- 因果中介方法
- 实例
- 实例1
- 实例2
- 实例3
原理
模型介绍
中介效应(Mediation effect) 是指自变量/暴露(X)通过一个中介变量(M)间接影响因变量/结果(Y)的机制。
在经典的单中介模型中,考察暴露对结果的总体效应:
Y=cX+e1Y=cX+e1 Y=cX+e1
c路径:X 对 Y 的总效应(不控制 M)
研究人员可能会假设,暴露对结果的总效应部分或全部是通过中介变量起作用的。X 不仅直接影响 Y,还可能通过影响 M,再进一步作用于 Y。
总效应可以分为两部分:直接效应和间接效应。
- 直接效应是去除 M 的贡献后 X 对 Y 的影响。这被称为c’ 路径。
- 间接效应是X通过 M对 Y 产生的影响。这相当于 a 路径与 b 路径的乘积。这被称为ab 路径。
M=aX+e2Y=c′X+bM+e3M=aX+e2 \\ Y = c'X + bM+e3 M=aX+e2Y=c′X+bM+e3
a 路径 : X → M 的影响
b 路径 :M → Y 的影响(控制X)
c′路径 :X → Y 的直接影响(控制M)
传统方法 因果步骤法
如果对方法比较感兴趣,接下来聊聊传统方法。
在 1986 年,Baron 和 Kenny 提出了一种被广泛使用至今的中介效应检验方法,也被称为 “因果步骤法”。
Baron 和 Kenny 方法涉及四个步骤:
- 检验 X 对 Y 的总体效应——要求X 显著预测 Y(即路径 c 显著)
- 测试X和M之间的关系——要求X 显著预测 M(即路径 a 显著)
- 测试 M 和 Y 之间的关系,控制 X——要求M 显著预测 Y(控制 X 后)(即路径 b 显著)
- 声明 M 是部分中介还是完全中介——要求控制 M 后,X 对 Y 的影响变弱或不显著(路径 c′小于路径 c),意思是如果 X 对 Y 的影响在引入 M 后大大减弱甚至不显著,就说明 M 起到了中介作用。
判断依据:c,a和b均显著, 说明中介效应显著。c’不显著, 则是完全中介;c’显著, 部分中介。
单中介模型中的中介效应可以用两种方式:差值法(c − c′)或者乘积法(a × b)计算。
差值法(c − c′):
即用总效应减去直接效应,得到中介效应。简单直观,但对模型要求比较高,适合 OLS 模型。
乘积法(a × b)
这是目前最常用的一种方法。它的思路是:
如果 X 对 M 的影响是 a,M 对 Y 的影响是 b,那么间接效应就是 a × b。
原理为中介效应取决于暴露影响中介变量的程度a,以及中介变量影响结果变量的程度b。
MacKinnon 等人(1995)证明了,对于正态理论最小二乘法和三个中介回归方程的最大似然估计,中介效应的âb̂和ĉ − ĉ ′ 测量具有代数等价性。对于多水平模型、逻辑回归或概率回归以及生存分析,中介效应的âb̂和ĉ − ĉ ′ 估计量并不总是等价的,需要对两者进行变换才能得出相似的结果。
要显著的路径有哪些?
是不是 a 路径、b 路径、c 路径都要显著才算中介?
其实不是!近年来因果步骤法一直备受争议。
- 争议点一:中介分析是否需要显著的总效应(c 路径)作为前提?
传统观点要求先检验 总效应 c 是否显著(X → Y),再继续进行中介分析(检验 ab)。如果 c 不显著,就中止分析,认为没有中介效应。
然而,这个前提不必要,甚至会误判存在的中介效应为无效。当 间接效应 ab 与直接效应 c′ 方向相反(即产生“抵消”),c 就可能不显著。
例子:小明没有房子 ≠ 小明没有通过中介买房子,可能小明买过又卖了,即中介路径存在,但总效应抵消。
因此,对总效应 c 进行检验。如果总效应显著, 则按之前中介效应解释。c不显著也可以直接往下一步检测系数a和系数b,按照遮掩效应解释。无论总效应 c 是否显著都不影响下一步检验, 只是结果解释不同。
举例:不一致中介模型
不一致中介模型是指模型中至少一个中介效应路径的符号与其他中介效应路径或直接效应路径不同。尽管 X 与 Y 关系的重要性对于解释结果很重要,但仍有几个例子表明 X 与 Y 的整体关系可能不显著,但中介作用却存在。例如,McFatter(1979)描述了一个假设的例子:工人制造小部件,其中 X 代表智力,M 代表无聊,Y 代表小部件产量。聪明的工人往往会感到无聊,产量更少,但更聪明的工人也往往会制造更多的小部件。因此,智力和生产的部件之间的整体关系实际上可能为零,但存在两个相反的中介过程。又称遮掩效应(Suppression Effect)。
“遮掩效应”是中介分析中的一种特殊情况,其本质是:中介路径的方向与直接路径方向相反,中介效应“抵消”了部分或全部的直接效应,甚至使总效应不显著或方向相反。
也就是说一方面智力 X 通过“增加无聊” M 间接降低产量 Y ;一方面智力 X 直接提升产量 Y ;两个路径方向相反,抵消总效应,所以:总效应(X ➝ Y)可能不显著,但中介效应(a × b)却显著。
这里我们需要阐明的结论是:X是如何通过M 的遮掩效应,以至于总体上不对 Y 产生影响。
- 争议点二:完全中介(c′ 不显著)与部分中介(c′ 显著)有必要区分吗?
显著性受样本量影响:大样本下即使效应很小也可能显著,导致“完全”与“部分”中介的区分很不稳定。
完全中介并不等于唯一中介:c′ 不显著只说明当前模型中 这个中介路径 占据主导,但并不否定还有其他潜在中介变量。
因此Preacher和Hayes (2008)建议放弃“完全 vs 部分中介”的标签,更推荐直接报告:总效应 c,直接效应 c′,间接效应 ab,以及 ab 的显著性(如 Bootstrap 置信区间)
如果直接效应c’不显著,可以表述为:自变量X主要通过中介变量M影响因变量Y。
对路径系数 a 和 b 进行依次检验,若二者均显著,说明可能存在中介效应。此时应进一步检验间接效应 ab 是否显著,推荐使用 Bootstrap 方法并报告置信区间。若置信区间不包含 0,可认为中介效应显著。接着可检验直接效应 c’。
由于 ab 是两个回归系数的乘积,它的分布不是正态的。所以我们不能用传统的 t 检验或 z 检验,而是用一种更稳健的办法:
Bootstrap 重抽样法
只需要告诉软件“抽1000次样本”,它会帮你:
- 每次都计算一次 ab
- 生成一个 ab 的分布
- 判断这个分布的置信区间是不是包含 0
- 如果 95% CI 不包含 0,则:中介效应显著!
因果中介方法
为什么传统的因果步骤法被质疑?
因果步骤法局限性:
(1)暴露-中介交互作用(X-M interaction)处理不当:
使用乘积法或差值法进行效应分解(即直接效应和间接效应相加等于总效应)仅适用于中介和结果模型采用线性回归,且不存在暴露-中介相互作用的特殊情况。如果存在相互作用,且采用传统方法,则获得的效应估计值将无法解释。
(2)未测量混杂(Unmeasured Confounding)假设不明确:
传统方法隐含了一个很强的假设:在 M → Y 这条路径上,我们必须假设没有其他未测量的变量同时影响了 M 和 Y,否则我们测到的 b 路径就会是有偏的(biased)。这个假设叫做无混杂假设(no unmeasured confounding)。
在观察性研究中,暴露(X)、中介(M)和结果(Y)都不是随机分配的,因此很多潜在变量(如遗传、家庭环境、教育水平等)可能同时影响中介和结果。
即使是随机对照试验(RCT),虽然暴露(X)可以随机化控制混杂,但通常 中介变量(M)并没有被随机化,所以还是可能存在 M → Y 路径上的混杂因素。
为了克服上述缺点,用于中介分析的因果推理方法(“因果中介”)是传统方法的扩展,能处理交互作用、未测混杂等问题。
这个方法可以在有XM交互作用的情况下,对总效应进行更严谨的分解(直接 + 间接)明确指出并要求检验4个假设,从而保证了无混杂假设。
这里并没有详细说明。可以参考:
https://www.publichealth.columbia.edu/research/population-health-methods/causal-mediation
实例
实例1
- 参考文献:https://onlinelibrary.wiley.com/doi/full/10.1002/hbm.25993
方法: 对于中介分析,仅包括同时具有幸福指数和幸福感 PGS 分数的参与者 (N = 19,461)。对于该子样本中与幸福指数和幸福感 PGS 显着相关的区域,我们测试了大脑形态测量是否介导 PGS 和幸福指数之间的关联。R 包 Lavaan v.0.6-9 用于测试中介模型,其中包括模型 1 中的基本协变量。
结果: 在较小的中介样本 (n = 19,461) 中重复关联分析,主要效应总结在图 S5 中。在较小样本中只有右侧 VIIIb 小脑与幸福指数和幸福PGS有显著关联 (Pfdr<0.016)。中介模型显示,右侧VIIIb小脑部分介导了~0.8%的幸福指数表型和幸福PGS之间的关联(总效应:β = 0.097,95%CI = 0.083–0.110,p < .001;总间接效应:β = 0.0008,95% CI = 0.0002–0.001,p = .005)。各个路径的系数如图 2 所示。
图: 幸福-PGS、右 VIIIb 小脑和幸福指数的中介模型路径图。该模型评估了右 VIIIb 小脑体积(在中央面板中通过相对于 Diedrichsen 小脑图谱的阴影对角线阴影显示)在幸福 PGS 和幸福指数之间关联中的中介作用。每条路径的标准化效应大小 (β) 都显示了。所有路径的 p 值为 <0.001。
备注*
这里的间接效应通过ab=0.0260.030=0.008算出来的,总效应为间接效应+直接效应=0.008+0.096=0.097
先算了一下与结果和暴露关联的区域,再对该区域做中介分析
图中的参数是每条路径的标准化效应大小
原文:
method:
2.6 Mediation analysis
For mediation analysis, only participants with scores for both wellbeing-index and wellbeing-PGS were included (N = 19,461). For regions that were significantly associated with both wellbeing-index and wellbeing-PGS in this sub-sample, we tested whether brain morphometric measures mediate the association between PGS and wellbeing-index. The R package Lavaan v.0.6-9 was used to test the mediation models, which included basic covariates from model 1.
result:
3.8 Mediation analysis
Association analyses were repeated in the smaller mediation sample (n = 19,461), with main effects summarised in Figure S5. Only right VIIIb cerebellum had significant (PFDR <0.016) associations with both wellbeing-index and wellbeing-PGS in the smaller sample. The mediation model showed that right VIIIb cerebellum partially mediates ~0.8% of the association between wellbeing-index phenotype and wellbeing-PGS (total effect: β = 0.097, 95% CI = 0.083–0.110, p < .001; total indirect effect: β = 0.0008, 95% CI = 0.0002–0.001, p = .005). Coefficients for individual paths are presented in Figure 2.
Fig:
Path diagram of the mediation model of wellbeing-PGS, right VIIIb cerebellum and wellbeing-index. The model assesses the mediation of the volume of right VIIIb cerebellum (shown in the central panel by hatched diagonal shading with respect to the Diedrichsen cerebellar atlas) in the association between wellbeing-PGS and wellbeing-index. The standardised effect sizes (β) are presented for each path. p value is <0.001 for all paths.
实例2
- 参考文献:https://pmc.ncbi.nlm.nih.gov/articles/PMC8894343/#Sec2
方法:
进行中介分析以估计脑容量对执行功能的方向影响。中介分析在 Lavaan 中运行,通过 1,000 次迭代进行非参数引导,以估计变量之间的直接和间接影响。单独的线性分析确定了个体大脑区域体积与执行功能之间的显着关联。使用 Bonferroni 方法对结果进行多重比较进行校正,并将这些区域与与睡眠持续时间相关的区域进行比较。
结果:
睡眠与执行功能之间的关系部分受脑容量介导
中介分析用于进一步检查睡眠时间、脑容量和执行功能之间的关系(图 14d). 睡眠时间在 6 到 8 小时之间与较高的执行功能显着相关(直接路径 c),这种关系部分由脑容量介导,使用睡眠相关区域的总体积测量,睡眠持续时间与执行功能之间的关系随着睡眠持续时间与脑容量(路径 a)和脑容量与执行功能(路径 b)之间的间接路径而降低。这种减少表现为 beta 值适度但显着下降,为 a*b = 0.01 (p < 0.001)。
图:
中介分析,值为标准化贝塔估计值。路径 a:六到八小时的睡眠时间与睡眠相关的脑区域容量之间的关系。路径 b:与睡眠相关的脑区域体积与执行功能之间的关系。路径 c:睡眠持续时间(6-8 小时)与执行功能之间的直接关系(a*b 值是间接途径的 beta 估计值,其中脑容量介导睡眠与执行功能之间的关系)。所有路径在 p < 0.001 时均显着。
备注解释:
X = 睡眠时间
M = 脑容量
Y = 执行功能
中介模型包括:
总效应(c):X → Y,不控制M
直接效应(c’):X → Y,控制M
间接效应(ab):X → M(a),M → Y(b)
总效应 c=c’+ab
在这里:
原始总效应是正的( β = 0.06)
加入脑容量这个中介后,直接效应变小了(β = 0.05)
而间接效应 ab = 0.01 是显著的
这意味着睡眠时间对执行功能的影响部分通过脑容量起作用,不是完全直接作用。
可以说:睡眠持续时间与执行功能之间的关系随着间接路径而降低。
实例3
参考文献:https://www.oxcns.org/papers/683%20Zhang%20You%20Rolls%20et%20al%202024%20Risk%20factors%20for%20suicide.pdf
Similar mediations were identified for factors such as age at first intercourse, depression, sleeplessness, risk-taking and loneliness. The NMR metabolites significantly mediated the effect of irritability on SA (indirect β = 8.28 × 10−5, P = 0.048; Fig. 7d). Brain structure significantly mediated the effect of BMI on SA (indirect β = 3.71 × 10−5, P = 0.027; Fig. 7c).