调整是否完全消除了混杂变量的影响?

机器算法验证 混杂 调整
2022-03-26 12:34:02

这似乎是一个愚蠢的问题,但我真的很困惑。理论上,对混杂变量进行调整应该会消除其影响。这总是正确的吗?这是否意味着我们调整的这个混杂变量的影响已经完全消除了?

例如,我们知道合并症的数量随着年龄的增长而增加。如果我们根据年龄进行调整,这是否意味着年龄不太可能部分解释合并症的增加?

1个回答

我没有完整的答案,但可以提供一些想法:

1)调整确实消除了混杂效应,但前提是正确指定了潜在的因果路径。在某些情况下,调整会导致偏差而不是减少偏差。有关此问题的更多信息,请搜索对撞机偏差和有向无环图

2) 调整确实消除了混杂效应,但前提是操作正确。换句话说,您选择了正确的变量来表示构造。有多种原因导致年龄可能不是衰老的良好指标(与死亡率相关的实际构造)。例如,致命的心脏病可能与生活方式有关。它也可能与免疫反应和身体如何介导炎症有关。所有这些因素在同一年龄内可能有很大差异。在报告方面,一个人的年龄漏报往往会随着年龄的增长而增加,并引入一些与年龄相关的错误。如果您控制了年龄,并认为您已经控制了与年龄相关的因素,那么这个假设通常过于雄心勃勃。了解控制变量的真正含义总是更重要。

3) 还有其他一些因素会导致单独调整不足。例如,年龄与模型中其他变量之间的交互作用可能会使年龄估计值产生偏差。年龄和死亡率之间的非线性关系也可能导致仅对年龄进行简单调整的方法不完善。

我的猜测是在流行病学中,每当有人问是否可以完全消除任何东西时,最好说“不”……也许除了“随机对照试验可以完全消除偏见吗?” 然后“理论上是的”。