通常在您阅读的研究文章中,研究人员已经控制了某些变量。这可以通过匹配、阻塞等方法来完成。
但我一直认为对变量的控制是通过测量几个可能有影响的变量并对这些变量进行一些统计分析来统计完成的,这可以在真实和准实验中完成。因此,例如,您将进行一项调查或其他测试,在其中您将测量自变量和一些可能的混杂变量并进行一些分析。
- 是否可以在准实验中控制变量?
- 变量匹配和统计控制等方法之间有什么联系?
通常在您阅读的研究文章中,研究人员已经控制了某些变量。这可以通过匹配、阻塞等方法来完成。
但我一直认为对变量的控制是通过测量几个可能有影响的变量并对这些变量进行一些统计分析来统计完成的,这可以在真实和准实验中完成。因此,例如,您将进行一项调查或其他测试,在其中您将测量自变量和一些可能的混杂变量并进行一些分析。
与 AdamO 一样,我认为回答这个问题的关键是因果推理的概念,以及如何使用观察设置“走向”因果模型。
在一个完美的世界里,我们会有一种叫做反事实人群的东西——研究人群,除了我们感兴趣的单一事物外,在所有方面都是相同的。基于这种差异,这两个人群之间的差异是真正的因果关系。
显然,我们不能拥有这个。
但是,有一些方法可以尝试接近它:
随机化:理论上(如果随机化正确完成)应该给你两个相同的人群,除了随机化后的治疗。
分层:您可以查看协变量水平内的总体,您可以在其中进行“类似与类似”的比较。这对于少量级别非常有效,但很快就会变得很麻烦。
匹配:匹配是一种尝试组合研究人群,使 A 组与 B 组相似,因此可以进行比较。
统计调整:在回归模型中包含协变量允许估计协变量水平内的影响 - 再次,比较相似,或至少尝试。
所有这些都是为了接近那个反事实的人群。如何最好地做到这一点取决于你想得到什么,以及你的学习是什么样的。
我认为因果模型是回答这个问题的关键。一开始就面临着在查看数据之前确定正确的调整/分层/控制的兴趣效应。如果我要估计成年人的身高/肺活量关系,我会根据吸烟状况进行调整,因为吸烟会阻碍生长并影响肺活量。混杂因素是与感兴趣的预测变量有因果关系并与感兴趣的结果相关的变量。参见 Judea Pearl 的因果关系,第 2 版。在数据收集过程甚至开始使用来自先前探索性研究的理性逻辑和先验知识之前,人们应该指定并支持他们对正确混杂变量的分析。
然而,这并不意味着一些研究人员不依赖数据驱动的方法来选择调整变量。在进行验证性分析时,我不同意在实践中这样做。多个调整模型的模型选择中的一些常用技术是前向/后向模型选择,您可以在其中限制您认为至少合理的模型类别。对此的黑盒 AIC 选择标准与可能性有关,因此与对于这些调整变量的线性模型。流行病学中常见的另一个过程是,如果变量将主效应的估计值(如优势比或风险比)改变至少 10%,则仅将变量添加到模型中。虽然这比基于 AIC 的模型选择“更”正确,但我仍然认为这种方法存在重大警告。
我的建议是预先指定所需的分析作为假设的一部分。年龄调整的吸烟/癌症风险是一个不同的参数,并且在对照研究中导致与粗吸烟/癌症风险不同的推论。使用主题知识是在回归分析中选择预测变量进行调整的最佳方式,或者在各种其他类型的实验和准实验设计的“受控”分析中作为分层、匹配或加权变量。
关于匹配和回归之间关系的故事在这里的一篇博文中进行了简要总结。简而言之
“在 D [治疗指标] 上回归 X [协变量] 的一整套虚拟(即饱和)模型。对 D 影响的结果估计等于对 X 的匹配,并通过方差对协变量单元格进行加权以X为条件的处理"
另请参阅Mostly Harmless Econometrics的第 3.3 节或Counterfactuals and Causal Inference的第 5.3 节进行深入讨论,包括回归隐含提供的给定 X 权重的 D 的利弊。
@EpiGrad 为您的第一个问题提供了一个良好的开端。上面链接的书籍几乎专门处理它。如果您没有计算机科学/数学背景,您可能会发现 Pearl 很难(尽管最终值得!)