机器算法验证 - 分析前后处理控制设计时的最佳实践 - 吾爱随笔录

分析前后处理控制设计时的最佳实践

机器算法验证方差分析安乔娃临床试验变化分数常问问题

2022-02-12 05:26:49

想象一下以下常见设计：

100 名参与者被随机分配到治疗组或对照组
因变量是数值型，在治疗前和治疗后测量

分析此类数据的三个明显选项是：

在混合方差分析中按时间交互效应测试分组
进行 ANCOVA，条件为 IV，前测为协变量，后测为 DV
使用条件作为 IV 和前后变化分数作为 DV 进行 t 检验

问题：

分析此类数据的最佳方法是什么？
有理由更喜欢一种方法而不是另一种方法吗？

4个回答

围绕这个主题（改变/获得分数）有大量文献，我认为最好的参考来自生物医学领域，例如

森恩，S（2007 年）。药物开发中的统计问题。威利（第 7 章，第 96-112 页）

在生物医学研究中，交叉试验的研究也进行了有趣的工作（特别是与遗留效应有关，尽管我不知道它对你的研究有多适用）。

从增益分数 t 到 ANCOVA F（反之亦然），来自 Knapp & Schaffer，对 ANCOVA 与 t 方法（所谓的 Lord 悖论）进行了有趣的回顾。根据 Senn 在他的文章Change from baseline and analysis of covariance revisited (Stat. Med. 2006 25(24)) 中，对变化分数的简单分析不是推荐的前/后设计方法。此外，使用混合效应模型（例如考虑两个时间点之间的相关性）并没有更好，因为您确实需要使用“预”测量作为协变量来提高精度（通过调整）。非常简短：

使用变化分数（后前，或结果基线）并不能解决不平衡的问题；前后测量之间的相关性小于 1，并且前后测量之间的相关性因此，如果按原始分数衡量的治疗（您的组分配）恰好是比较不公平的劣势控制，它将具有不公平的优势，改变分数。 $-$ $-$ $-$
ANCOVA 中使用的估计量的方差通常低于原始或更改分数的方差（除非前后之间的相关性等于 1）。
如果两组之间的前/后关系不同（斜率），则问题并不比任何其他方法大（变化分数方法还假设两组之间的关系相同——平行斜率假设）。
在治疗平等（关于结果）的零假设下，预计没有交互治疗 x 基线；拟合这样的模型是危险的，但在这种情况下，必须使用居中的基线（否则，治疗效果是在协变量起源处估计的）。

我也喜欢Edwards 的十个差异分数神话，尽管它侧重于不同背景下的差异分数；但这里有一个关于分析前后变化的带注释的参考书目（不幸的是，它不包括最近的工作）。Van Breukelen 还比较了随机和非随机环境中的 ANOVA 与 ANCOVA，他的结论支持 ANCOVA 是首选的观点，至少在随机研究中（防止回归到平均效应）。

Daniel B. Wright 在他的文章与您的数据交朋友的第 5 节中讨论了这一点。他建议（第 130 页）：

在这种情况下，唯一始终正确的程序是将不同组在时间 2 的分数与时间 1 的分数进行比较的散点图。在大多数情况下，您应该以多种方式分析数据。如果这些方法给出不同的结果……请更仔细地考虑每种方法所隐含的模型。

他推荐以下文章作为延伸阅读：

手，DJ（1994 年）。解构统计问题。皇家统计学会杂志：A, 157, 317–356。
调频勋爵 (1967)。组比较解释中的一个悖论。心理公报，72，304-305。免费PDF
怀纳，H. (1991)。调整不同的基本利率：再次出现洛德悖论。心理公报, 109, 147–151。免费PDF

最常见的策略是：

重复测量方差分析与一个主体内因素（测试前与测试后）和一个主体间因素（治疗与控制）。
治疗后评分的 ANCOVA，治疗前评分作为协变量，治疗作为自变量。直观地说，这个想法是测试两组之间的差异确实是您所追求的，并且与简单的 t 检验或 ANOVA 相比，将预测试分数作为协变量包括在内可以增加功效。

关于这两种方法之间的解释、假设和明显矛盾的差异以及更复杂的替代方案（特别是当参与者不能被随机分配到治疗时）有很多讨论，但我认为它们仍然很标准。

混淆的一个重要来源是，对于 ANOVA，感兴趣的影响很可能是时间和治疗之间的相互作用，而不是治疗的主效应。顺便说一句，这个交互项的 F 检验将产生与增益分数的独立样本 t 检验完全相同的结果（即通过从每个参与者的后测分数中减去前测分数获得的分数），所以你可能也去。

如果这一切都太多了，你没有时间弄清楚，也无法从统计学家那里获得一些帮助，一个快速而肮脏但绝不完全荒谬的方法是简单地将后测分数与独立样本 t 检验，忽略前测值。只有当参与者实际上被随机分配到治疗组或对照组时，这才有意义。

最后，这本身并不是一个很好的选择它的理由，但我怀疑上面的方法 2（ANCOVA）是目前心理学中正确方法所采用的方法，所以如果你选择其他方法，你可能需要详细解释该技术或证明其合理性向一个确信的人说自己，例如“众所周知，成绩不好”。

交互项的 ANCOVA 和重复测量/混合模型正在测试两个不同的假设。参考这篇文章：第 1条和这篇文章：第 2 条

其它你可能感兴趣的问题

上一篇95% 置信区间内的所有值是否均等？下一篇如何更改 ggplot2 中图例的标题？