Andrew Gelman 在他与 Jennifer Hill 合着的书中,在第 9 章(第 9.3 节)第 177 页中指出:
仅适用于控制治疗前预测因子,或更一般地说,控制不受治疗影响的预测因子(例如种族或年龄)。这一点将在第 9.7 节中更具体地说明......
并且在那里(9.7 题为“不控制后处理变量”)他讨论了测量中介变量的问题,而不是直接的前后变化问题。
重要的是要在这里声明,我认为 Gelman/Hill 是一部出色的文本……而且我非常喜欢理解它。然而,这一点引起了我的兴趣,因为它让我想起了 Everitt & Pickles 解决同一问题的方法。
Everitt 认为,使用变化分数(分数 B - 分数 A)会使您的发现偏向于治疗,而在模型中包含基线分数则更为保守。他们通过模拟来支持这一点——这很有说服力。
到目前为止,我的理解是,您要控制的是基线分数的组差异,这可能会导致明显的治疗效果大于或存在,但实际上并不存在。我的理解也是,这是因为回归均值在起作用,因此较高的基线分数将与较大的下降相关联,反之亦然,与治疗效果无关。
Everitt 强烈反对“改变分数”,而 Gelman 似乎建议不要在模型中包含基线分数。
然而,Gelman 在接下来的 2-3 页中展示了这一点,包括作为预测指标的预测试分数。他警告说,您会得到一系列看似合理的治疗效果,这些效果取决于预测试分数,而不是仅代表效果不确定性的一系列治疗效果。
我的观点是,使用“变化分数”似乎并没有真正对均值回归做任何事情,而将基线分数作为预测变量允许基线组差异抵消,本质上是引入协方差结构。
我是一名医生,我必须对哪些治疗有效做出真正的决定。所以我该怎么做?包括每个人的基线分数或使用“更改分数”?