随机化测试和排列测试之间的区别

机器算法验证 假设检验 采样 术语 置换检验
2022-02-03 12:32:59

在文献中,术语随机化和排列可以互换使用。许多作者都说“排列(又名随机化)测试”,反之亦然。

充其量我相信差异是微妙的,它在于他们对数据的假设和可以得出的潜在结论。我只需要检查我的理解是否正确,或者我是否缺少更深层次的差异。

置换检验假设数据是从潜在的总体分布(总体模型)中随机抽样的。这意味着从置换检验得出的结论通常适用于来自人群的其他数据 [3]。

随机化测试(随机化模型)“允许我们放弃典型心理学研究的不可信假设——从指定分布中随机抽样”[2]。然而,这意味着得出的结论仅适用于测试中使用的样本 [3]。

当然,区别仅在于人口的定义。如果我们将人群定义为“所有患有该疾病且适合治疗的患者”,那么置换检验对该人群有效。但是因为我们将人群限制在适合治疗的人群中,所以这实际上是一个随机化测试。

参考文献:
[1] Philip Good,置换检验:检验假设的重采样方法实用指南。
[2] Eugene Edgington 和 Patric Onghena,随机化测试。
[3] Michael Ernst,排列方法:精确推理的基础

1个回答

有相当多的重叠,最常见的排列测试形式是随机化测试。

一些纯粹主义者认为真正的排列测试基于数据的每一种可能排列。但在实践中,我们从所有可能的排列集中进行采样,因此这是一个随机化测试。

还有引导测试,如果我们没有找到所有可能的引导样本,而是从可能的集合中找到样本(通常是这样做的),那么这也是一个随机化测试(但不是排列测试)。