是否可以有一个变量同时充当效果修饰符和混杂因素?

机器算法验证 相互作用 因果关系 混杂
2022-03-15 20:24:54

对于给定的一对风险结果关联,是否有可能有一个变量既充当效果(测量)修饰符又充当混杂因素?

我仍然有点不确定区别。我查看了图形符号以帮助我理解差异,但符号的差异令人困惑。两者的图形/视觉解释以及它们何时可能重叠将是有用的。

2个回答

混杂变量必须:

  • 与结果独立相关;
  • 与曝光相关联
  • 不得位于暴露和结果之间的因果关系上。

这些是将变量视为潜在混杂变量的标准。如果发现潜在的混杂因素(通过分层和调整测试)实际上混淆了风险和结果之间的关系,那么在风险和结果之间看到的任何未经调整的关联都是混杂因素的产物,因此不是真正的影响。

另一方面,效果修饰符不会混淆。如果效果是真实的,但效果的大小因某个变量 X 而异,则该变量 X 是效果修饰符。

因此,要回答您的问题,据我了解,对于给定的研究样本和给定的一对风险因素和结果,不可能有一个既充当效果修饰符又充当混杂变量的变量。

你可以在这里找到更多信息

是的,一个变量绝对有可能既是混杂因素又是效果修饰符。我们可以在 R 中运行一个快速模拟来验证这一点:考虑以下机制x作为治疗和y结果。c影响两者xy因此,它是一个混杂因素。但它也与 x 相互作用,因此改变了它对 y 的影响。

set.seed(234)
c <- runif(10000)
x <- c + rnorm(10000, 0, 0.1)
y <- 3*x + 2*x*c + rnorm(10000)

所以我们知道真正的因果机制是y=3x+2xc. 清楚地,c修改效果x. 但是,当我们运行回归时yx只是,我们还看到了令人困惑的事情:

lm(y ~ x) 
Coefficients:
(Intercept)            x  
     -0.258        4.856 

最后,正如我在评论中指出的那样,oisyutat 给出的定义是错误的。它反映了 Judea Pearl 所说的混杂因素的“关联标准”,他给出了这个定义失败的多种原因。参见 Pearl (2009),因果关系,第 6.3 节。