置换检验的假设是什么?

机器算法验证 假设检验 置换检验 重采样
2022-01-26 12:34:58

人们经常说置换测试没有假设,但这肯定不是真的。例如,如果我的样本以某种方式相关,我可以想象排列它们的标签将不是正确的做法。只觉得我发现这个问题是维基百科的这句话:“置换检验背后的一个重要假设是,观察结果在原假设下是可交换的。” 我不明白。

置换检验的假设是什么?这些假设如何与不同的可能排列方案相关联?

1个回答

文献区分了两种类型的排列测试:(1)随机化测试是通过将实验单元随机分配到条件来满足交换性的排列测试;(2) 置换检验是完全相同的检验,但适用于需要其他假设(即,除了随机分配)来证明可交换性的情况。

关于命名约定的一些参考资料(即随机化与排列): Kempthorne & Doerfler,Biometrika,1969;Edgington & Onghena,随机化测试,第 4 版,2007]

对于假设,随机化检验(即实验数据的费舍尔随机化检验)只需要唐纳德鲁宾所说的稳定单位处理值假设 (SUTVA)。参见 Rubin 1980 年在 JASA 上对 Basu 论文的评论。SUTVA 也是 Neyman-Rubin 潜在结果模型(参见 Paul Holland 1986 年 JASA论文)下因果推理的基本假设之一(以及强可忽略性)。从本质上讲,SUTVA 说单位之间没有干扰,所有接受者的治疗条件都是相同的。更正式地说,SUTVA 假定潜在结果和分配机制之间是独立的。

考虑随机分配到对照组或治疗组的参与者的两样本问题。例如,如果两个研究参与者认识并且其中一个的分配状态对另一个的结果产生了一些影响,那么 SUTVA 就会被违反。这就是单元之间没有干扰的意思。

上述讨论适用于随机化测试,其中参与者被随机分配到组中。在置换测试的情况下,SUTVA 也是必要的,但它可能不会依赖于随机化,因为没有。

在没有随机分配的情况下,置换检验的有效性可能依赖于分布假设,例如相同形状的分布或对称分布(取决于检验)以满足可交换性(参见Box 和 Anderson,JRSSB,1955 年)。

在一篇有趣的论文中,Hayes, Psych Methods, 1996 通过模拟表明,如果对非随机数据使用置换测试,I 类错误率可能会变得过高。