机器算法验证 - 是否可以有一个变量同时充当效果修饰符和混杂因素？ - 吾爱随笔录

机器算法验证相互作用因果关系混杂

2022-03-15 20:24:54

对于给定的一对风险结果关联，是否有可能有一个变量既充当效果（测量）修饰符又充当混杂因素？

我仍然有点不确定区别。我查看了图形符号以帮助我理解差异，但符号的差异令人困惑。两者的图形/视觉解释以及它们何时可能重叠将是有用的。

2个回答

混杂变量必须：

这些是将变量视为潜在混杂变量的标准。如果发现潜在的混杂因素（通过分层和调整测试）实际上混淆了风险和结果之间的关系，那么在风险和结果之间看到的任何未经调整的关联都是混杂因素的产物，因此不是真正的影响。

另一方面，效果修饰符不会混淆。如果效果是真实的，但效果的大小因某个变量 X 而异，则该变量 X 是效果修饰符。

因此，要回答您的问题，据我了解，对于给定的研究样本和给定的一对风险因素和结果，不可能有一个既充当效果修饰符又充当混杂变量的变量。

是的，一个变量绝对有可能既是混杂因素又是效果修饰符。我们可以在 R 中运行一个快速模拟来验证这一点：考虑以下机制 $x$ 作为治疗和 $y$ 结果。 $c$ 影响两者 $x$ 和 $y$ 因此，它是一个混杂因素。但它也与 x 相互作用，因此改变了它对 y 的影响。

set.seed(234)
c <- runif(10000)
x <- c + rnorm(10000, 0, 0.1)
y <- 3*x + 2*x*c + rnorm(10000)

所以我们知道真正的因果机制是 $y = 3*x + 2*x*c$ . 清楚地， $c$ 修改效果 $x$ . 但是，当我们运行回归时 $y$ 在 $x$ 只是，我们还看到了令人困惑的事情：

lm(y ~ x) 
Coefficients:
(Intercept)            x  
     -0.258        4.856

最后，正如我在评论中指出的那样，oisyutat 给出的定义是错误的。它反映了 Judea Pearl 所说的混杂因素的“关联标准”，他给出了这个定义失败的多种原因。参见 Pearl (2009)，因果关系，第 6.3 节。

其它你可能感兴趣的问题