想象一下以下常见设计:
- 100 名参与者被随机分配到治疗组或对照组
- 因变量是数值型,在治疗前和治疗后测量
分析此类数据的三个明显选项是:
- 在混合方差分析中按时间交互效应测试分组
- 进行 ANCOVA,条件为 IV,前测为协变量,后测为 DV
- 使用条件作为 IV 和前后变化分数作为 DV 进行 t 检验
问题:
- 分析此类数据的最佳方法是什么?
- 有理由更喜欢一种方法而不是另一种方法吗?
想象一下以下常见设计:
分析此类数据的三个明显选项是:
问题:
围绕这个主题(改变/获得分数)有大量文献,我认为最好的参考来自生物医学领域,例如
森恩,S(2007 年)。药物开发中的统计问题。威利(第 7 章,第 96-112 页)
在生物医学研究中,交叉试验的研究也进行了有趣的工作(特别是与遗留效应有关,尽管我不知道它对你的研究有多适用)。
从增益分数 t 到 ANCOVA F(反之亦然),来自 Knapp & Schaffer,对 ANCOVA 与 t 方法(所谓的 Lord 悖论)进行了有趣的回顾。根据 Senn 在他的文章Change from baseline and analysis of covariance revisited (Stat. Med. 2006 25(24)) 中,对变化分数的简单分析不是推荐的前/后设计方法。此外,使用混合效应模型(例如考虑两个时间点之间的相关性)并没有更好,因为您确实需要使用“预”测量作为协变量来提高精度(通过调整)。非常简短:
我也喜欢Edwards 的十个差异分数神话,尽管它侧重于不同背景下的差异分数;但这里有一个关于分析前后变化的带注释的参考书目(不幸的是,它不包括最近的工作)。Van Breukelen 还比较了随机和非随机环境中的 ANOVA 与 ANCOVA,他的结论支持 ANCOVA 是首选的观点,至少在随机研究中(防止回归到平均效应)。
Daniel B. Wright 在他的文章与您的数据交朋友的第 5 节中讨论了这一点。他建议(第 130 页):
在这种情况下,唯一始终正确的程序是将不同组在时间 2 的分数与时间 1 的分数进行比较的散点图。在大多数情况下,您应该以多种方式分析数据。如果这些方法给出不同的结果……请更仔细地考虑每种方法所隐含的模型。
他推荐以下文章作为延伸阅读:
最常见的策略是:
关于这两种方法之间的解释、假设和明显矛盾的差异以及更复杂的替代方案(特别是当参与者不能被随机分配到治疗时)有很多讨论,但我认为它们仍然很标准。
混淆的一个重要来源是,对于 ANOVA,感兴趣的影响很可能是时间和治疗之间的相互作用,而不是治疗的主效应。顺便说一句,这个交互项的 F 检验将产生与增益分数的独立样本 t 检验完全相同的结果(即通过从每个参与者的后测分数中减去前测分数获得的分数),所以你可能也去。
如果这一切都太多了,你没有时间弄清楚,也无法从统计学家那里获得一些帮助,一个快速而肮脏但绝不完全荒谬的方法是简单地将后测分数与独立样本 t 检验,忽略前测值。只有当参与者实际上被随机分配到治疗组或对照组时,这才有意义。
最后,这本身并不是一个很好的选择它的理由,但我怀疑上面的方法 2(ANCOVA)是目前心理学中正确方法所采用的方法,所以如果你选择其他方法,你可能需要详细解释该技术或证明其合理性向一个确信的人说自己,例如“众所周知,成绩不好”。