多元回归真正“控制”协变量有多好?

机器算法验证 多重回归 安乔娃 观察研究
2022-01-22 11:05:49

我们都熟悉观察性研究,这些研究试图通过在多元回归模型中包含所有可以想象的潜在混杂因素来建立非随机预测变量 X 和结果之间的因果关系。通过这样“控制”所有混杂因素,我们可以分离出感兴趣的预测变量的影响。

我对这个想法越来越感到不安,这主要是基于我统计课上的不同教授的不经意的评论。它们分为几个主要类别:

1.您只能控制您想到和测量的协变量。
这是显而易见的,但我想知道它是否真的是最有害和最不可克服的。

2. 这种方法在过去曾导致严重的错误。

例如,Pettitti & Freedman (2005)讨论了数十年的统计调整观察研究如何得出关于激素替代疗法对心脏病风险影响的灾难性错误结论。后来的随机对照试验发现几乎相反的效果。

3. 当您控制协变量时,预测变量-结果关系可能会表现得很奇怪。

Yu-Kang Tu, Gunnell, & Gilthorpe (2008) 讨论了一些不同的表现形式,包括罗德悖论、辛普森悖论和抑制变量。

4. 单个模型(多元回归)很难充分调整协变量并同时对预测变量-结果关系进行建模。

我听说这是倾向得分和混杂因素分层等方法优越的原因,但我不确定我是否真的理解它。

5. ANCOVA 模型要求协变量和感兴趣的预测变量是独立的。

当然,我们会精确地调整混杂因素,因为它们与感兴趣的预测变量相关,因此,在我们最需要的确切情况下,该模型似乎不会成功。争论的观点是,调整只适用于随机试验中的降噪。Miller & Chapman, 2001给出了很好的评价。

所以我的问题是:

  1. 这些问题和其他我可能不知道的问题有多严重?
  2. 当我看到一项“控制一切”的研究时,我应该有多害怕?

(我希望这个问题不会冒险进入讨论领域,并很乐意邀请​​任何改进它的建议。)

编辑:我在找到新参考后添加了第 5 点。

2个回答

有一个被广泛接受的,也许是非统计的答案 - 需要做出什么样的假设才能声称一个人真正控制了协变量。

这可以通过 Judea Pearl 的因果图和微积分来完成。

请参阅 http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf 以及他网站上的其他材料。

现在作为统计学家,我们知道所有模型都是错误的,而真正的统计问题是那些确定的假设可能不太错误,因此我们的答案大致可以。珀尔意识到了这一点,并在他的工作中讨论了这一点,但可能没有明确和经常性地避免许多统计学家因为他声称有答案而感到沮丧(我相信他这样做是因为人们需要做出哪些假设?)。

(目前 ASA 正在为将这些方法纳入统计课程的教材提供奖励,请参见此处

对问题 1 的回答:

  • 严重性的大小最好根据上下文进行评估 (即,应考虑所有有助于有效性的因素)。
  • 不应该以分类的方式评估严重程度。一个例子是研究设计的推理层次概念(例如,病例报告最低,RCT 绝对最高)。这种类型的方案经常在医学院教授,​​作为一种快速识别高质量证据的简单启发式方法。这种思维方式的问题在于它是算法性的并且在现实中过于确定,答案本身就是过度确定的。发生这种情况时,您可能会错过设计不佳的 RCT 会产生比设计良好的观察性研究更差的结果的方式。
  • 请参阅这篇易于阅读的评论,从流行病学家的角度全面讨论上述观点(Rothman,2014 年)

回答问题 2: