我们都熟悉观察性研究,这些研究试图通过在多元回归模型中包含所有可以想象的潜在混杂因素来建立非随机预测变量 X 和结果之间的因果关系。通过这样“控制”所有混杂因素,我们可以分离出感兴趣的预测变量的影响。
我对这个想法越来越感到不安,这主要是基于我统计课上的不同教授的不经意的评论。它们分为几个主要类别:
1.您只能控制您想到和测量的协变量。
这是显而易见的,但我想知道它是否真的是最有害和最不可克服的。
2. 这种方法在过去曾导致严重的错误。
例如,Pettitti & Freedman (2005)讨论了数十年的统计调整观察研究如何得出关于激素替代疗法对心脏病风险影响的灾难性错误结论。后来的随机对照试验发现几乎相反的效果。
3. 当您控制协变量时,预测变量-结果关系可能会表现得很奇怪。
Yu-Kang Tu, Gunnell, & Gilthorpe (2008) 讨论了一些不同的表现形式,包括罗德悖论、辛普森悖论和抑制变量。
4. 单个模型(多元回归)很难充分调整协变量并同时对预测变量-结果关系进行建模。
我听说这是倾向得分和混杂因素分层等方法优越的原因,但我不确定我是否真的理解它。
5. ANCOVA 模型要求协变量和感兴趣的预测变量是独立的。
当然,我们会精确地调整混杂因素,因为它们与感兴趣的预测变量相关,因此,在我们最需要的确切情况下,该模型似乎不会成功。争论的观点是,调整只适用于随机试验中的降噪。Miller & Chapman, 2001给出了很好的评价。
所以我的问题是:
- 这些问题和其他我可能不知道的问题有多严重?
- 当我看到一项“控制一切”的研究时,我应该有多害怕?
(我希望这个问题不会冒险进入讨论领域,并很乐意邀请任何改进它的建议。)
编辑:我在找到新参考后添加了第 5 点。