在随机对照试验中,应该如何控制治疗前评分的群体和个体差异?

机器算法验证 临床试验
2022-03-20 04:33:53

Andrew Gelman 在他与 Jennifer Hill 合着的书中,在第 9 章(第 9.3 节)第 177 页中指出:

仅适用于控制治疗前预测因子,或更一般地说,控制不受治疗影响的预测因子(例如种族或年龄)。这一点将在第 9.7 节中更具体地说明......

并且在那里(9.7 题为“不控制后处理变量”)他讨论了测量中介变量的问题,而不是直接的前后变化问题。

重要的是要在这里声明,我认为 Gelman/Hill 是一部出色的文本……而且我非常喜欢理解它。然而,这一点引起了我的兴趣,因为它让我想起了 Everitt & Pickles 解决同一问题的方法。

Everitt 认为,使用变化分数(分数 B - 分数 A)会使您的发现偏向于治疗,而在模型中包含基线分数则更为保守。他们通过模拟来支持这一点——这很有说服力。

到目前为止,我的理解是,您要控制的是基线分数的组差异,这可能会导致明显的治疗效果大于或存在,但实际上并不存在。我的理解也是,这是因为回归均值在起作用,因此较高的基线分数将与较大的下降相关联,反之亦然,与治疗效果无关。

Everitt 强烈反对“改变分数”,而 Gelman 似乎建议不要在模型中包含基线分数。

然而,Gelman 在接下来的 2-3 页中展示了这一点,包括作为预测指标的预测试分数。他警告说,您会得到一系列看似合理的治疗效果,这些效果取决于预测试分数,而不是仅代表效果不确定性的一系列治疗效果。

我的观点是,使用“变化分数”似乎并没有真正对均值回归做任何事情而将基线分数作为预测变量允许基线组差异抵消,本质上是引入协方差结构。

我是一名医生,我必须对哪些治疗有效做出真正的决定。所以我该怎么做?包括每个人的基线分数或使用“更改分数”?

1个回答

{我在作弊,为评论框添加的评论太长了。} 感谢您的解释。听起来你好像找到了一些很棒的资源,并且做了很多工作来从中汲取教训。还有其他值得一读的资料,例如库克和坎贝尔的准实验中的一章;Geoffrey Keppel 的设计与分析部分;我认为至少有一篇唐纳德鲁宾的文章。我还将提供一个我从 Damian Betebenner 关于学生考试成绩的工作中收集(转述)的课程:

如果没有某种干预,预期不会有任何改善是否合理?如果是这样,分析增益分数是有意义的,就像方差分析一样。是否有理由认为即使没有干预,所有学生都会在一定程度上有所提高,并且他们的后测分数可以预测为他们的前测分数的线性函数?如果是这样,协方差分析将是有意义的。

来自ANOVA/ANCOVA 流程图

此外,也许您知道这一点,但 Betebenner 提到的 Lord's Paradox 涉及使用相同数据获得零均值差的结果的可能性,使用这两种方法中的一种,但使用另一种方法获得显着差异的结果。

我的看法,基于可能比你更有限的阅读,是这两种方法都有一席之地,埃弗里特和也许还有格尔曼,尽管他们很伟大,但在这种情况下,他们采取了太强硬的路线。