中介分析本质上是因果关系吗?

机器算法验证 因果关系 调解
2022-02-04 22:35:35

我有兴趣使用一个 IV、一个 DV 和一个中介来测试一个简单的中介模型。经 Preacher 和 Hayes SPSS 宏测试,间接影响是显着的,这表明中介确实起到了统计中介关系的作用。

在阅读调解时,我读过诸如“注意调解模型是因果模型”之类的内容。-大卫肯尼我当然可以欣赏使用中介模型作为因果模型,事实上,如果一个模型在理论上是合理的,我可以认为这非常有用。

然而,在我的模型中,中介(被认为是焦虑症素质的特征)不是由自变量(焦虑症的症状)引起的。相反,中介变量和自变量是相关的,我相信自变量和因变量之间的关联在很大程度上可以通过 IV-mediator-DV 之间的方差来解释。从本质上讲,我试图证明以前关于 IV-DV 关系的报告可以由不是由 IV 引起的相关调解人来解释。

中介在这种情况下很有用,因为它解释了 IV-DV 关系如何可以通过 IV-Mediator-DV 关系进行统计解释。我的问题是因果关系的问题。是否可以回过头来告诉我们调解不合适,因为 IV 实际上不会导致调解员(我一开始就不会争论)?

这有意义吗?对此事的任何反馈将不胜感激!

编辑:我的意思是,X 与 Y 相关不是因为它导致 Y,而是因为 Z 导致 Y(部分)并且因为 X 和 Z 高度相关。有点混乱,但就是这样。在这种情况下,因果关系并没有真正的问题,而且这份手稿也没有太多关于因果关系的问题。我只是试图证明 X 和 Y 之间的差异可以通过 Z 和 Y 之间的差异来解释。所以基本上,X 通过 Z 与 Y 间接相关(在这种情况下为“中介”)。

4个回答

A. “调解”在概念上意味着因果关系(正如肯尼引述所指出的那样)。因此,将变量视为中介的路径模型意味着传达某种处理通过其对中介的影响来影响结果变量,而方差反过来又会导致结果发生变化。但是将某物建模为“调解人”并不意味着它真的调解人——这是因果关系的问题。您对 Macro 的回复和评论表明您在考虑路径分析,其中变量被建模为中介但不被视为“因果”;不过,我不太明白为什么。您是否认为这种关系是虚假的——存在一些第三变量导致“自变量”和“中介”?也许您分析中的“自变量”和“中介”实际上都是第三个变量对结果变量影响的中介?如果是这样,那么审阅者(或任何有思想的人)会想知道第三个变量是什么以及你有什么证据表明它负责实际上是中介之间的虚假关系。

B. 延伸 Macro 的帖子,这是一个臭名昭著的丛林,长满了教条和经院哲学。但这里有一些亮点:

  1. 有些人认为,只有通过实验操纵调解员以及假设发挥因果效应的影响,才能“证明”调解。因此,如果你做了一个只操纵因果影响的实验,并观察到它对结果变量的影响反映在中介的变化上,他们会“不!不够好!” 不过,基本上,他们只是认为观察方法不支持因果推论,而实验中未经操纵的中介对他们来说只是一个特例。

  2. 其他人,虽然没有从观察研究中排除因果推论,但仍然相信,如果你使用非常非常复杂的统计方法(包括但不限于将假定中介关系的协方差矩阵与那些比较的结构方程模型)对于各种替代方案),您可以有效地使我刚才提到的批评者保持沉默。基本上这是男爵和肯尼,但使用类固醇。从经验上讲,他们并没有让他们沉默。从逻辑上讲,我不明白他们怎么能。

  3. 还有一些人,最著名的是 Judea Pearl,说无论是实验研究还是观察研究,因果推论的可靠性都无法用统计数据来证明。推理的强度源于设计的有效性。统计数据仅证实因果推理所考虑或依赖的效果。

一些读物(所有这些都很好,不是教条或学术的):

最后但并非最不重要的一点是,格尔曼和珀尔之间关于因果推理的冷静交流的一部分,其中调解是中心焦点:http ://andrewgelman.com/2007/07/identification/

因果关系和中介

  • 中介模型对因果关系提出理论主张。
    • 该模型提出,IV原因DV和这种影响完全或部分由因果关系链解释,其中IV原因MEDIATOR反过来导致DV
  • 对中介模型的支持并不能证明所提出的因果路径。
    • 中介的统计测试通常基于观察性研究。替代因果解释的范围很大(例如,第三变量、替代方向、互惠等)
    • 我通常不会被那些提出中介模型中隐含的因果主张的研究人员提出的论点(如果有的话)说服。
  • 在为因果主张建立论证时,对中介模型的支持可以提供证据来补充其他证据来源。总之,相关性不能证明因果关系,但可以提供补充证据。
  • 尽管观察性研究中的中介测试存在局限性,(a) 中介模型有利于让研究人员思考因果路径,(b) 编写中介模型的方法有好有坏,更好的方法承认解释中的细微差别和为拟议的因果途径和替代因果途径的证据提供全面的理论讨论(请参阅我准备的这一页提示)。
  • @dmk38 提供了一些优秀的参考资料和额外的讨论。

表明一个变量解释了另一个变量的预测

  • 根据您的描述,调解似乎与您的研究问题不一致。因此,我会避免在您的分析中使用调解语言。
  • 据我了解,您的研究问题是关于一个变量(让我们称之为而不是)的预测是否X1IV第二DV个变量(让我们称之为X2而不是MEDIATOR)来解释。您可能还提出了类似X2原因的因果声明,DVX1仅与原因相关且X2与原因无关DV
  • 有几个统计测试可能适合测试这个研究问题:
    • 将零阶X1DV与半偏相关与)X1进行比较我想有趣的元素是减少的程度,而不是统计显着性(尽管您当然希望获得一些关于减少的置信区间)。X2DV
    • 或者类似地,将X2在块 1 和X1块 2 中添加的分层回归的增量 R 平方与仅X1预测的模型的 R 平方进行比较DV
    • 我想您还可以绘制与您的因果假设一致的路径图(例如,和之间的双箭头X1和之间X2的单箭头X2DV

我相信您所谈论的那些变量,如果 IV 不会导致它们,则可能应该被视为“控制”变量,或者如果您期望交互效应,则应该被视为调节变量。在纸上试一试,在脑海中反复思考几次,或者画出假设的效果。

也许更好的语言,或者至少不那么令人困惑的是虚假的相关性。一个典型的例子是冰淇淋消费与溺水有关。因此,有人可能会认为,吃冰淇淋会导致溺水。当第三个“调节”变量实际上与前两个变量有因果关系时,就会出现虚假相关。在我们的例子中,我们及时观察了冰淇淋的销售和溺水情况,忘记了温度调节的季节性影响,果然,天气热的时候吃的冰淇淋更多,淹死的人更多,因为更多的是寻求解脱通过游泳和吃冰淇淋来消暑。一些幽默的例子

那么,问题归结为人们会使用虚假相关性来做什么?而且,事实证明,它们被使用是因为人们不测试他们的理论。例如,肾功能通常被“标准化”为估计的体表,如通过体重和身高的公式估计的那样。

现在,体表面积不会导致尿液形成,并且在体重和身高公式中,通过克莱伯定律,体重是因果关系,而身高实际上使公式的预测性降低。