在原假设下,可交换样本背后的直觉是什么?

机器算法验证 假设检验 直觉 置换检验 可交换性
2022-02-10 18:16:53

t-test排列测试(也称为随机化测试、重新随机化测试或精确测试)非常有用,并且在不满足例如所要求的正态分布假设以及通过排序转换值时派上用场非参数测试Mann-Whitney-U-test会导致更多信息丢失。然而,在使用这种检验时,一个且唯一的一个假设是在原假设下样本可交换性的假设。还值得注意的是,当有两个以上的样本时,也可以应用这种方法,比如在coinR 包中实现的样本。

你能用一些比喻性的语言或简单的英语概念直觉来说明这个假设吗?这对于澄清像我这样的非统计学家中被忽视的问题非常有用。

注意:
如果在相同的假设下应用置换测试不成立或无效,这将非常有帮助。

更新:
假设我从我所在地区的当地诊所随机收集了 50 名受试者。他们以 1:1 的比例随机分配接受药物或安慰剂。它们都Par1在 V1(基线)、V2(3 个月后)和 V3(1 年后)测量参数 1。所有 50 个科目可以根据特征 A 分为 2 个组;A 正 = 20 和 A 负 = 30。它们也可以根据特征 B 分为另外 2 个组;B 阳性 = 15 和 B 阴性 = 35。
现在,我Par1在所有访问中都有来自所有主题的值。在可交换性的假设下,Par1如果我愿意,我是否可以在使用置换检验的水平之间进行比较:
- 将服用药物的受试者与接受安慰剂的受试者在 V2 进行比较?
- 在 V2 中比较具有特征 A 的科目和具有特征 B 的科目?
- 比较在 V2 时具有特征 A 的受试者与在 V3 时具有特征 A 的受试者?
- 在何种情况下,这种比较是无效的并且会违反可交换性的假设?

1个回答

一、非形象性描述:可交换性是指联合分布对联合分布中各变量值的排列不变(即f_等)。如果不是这种情况,那么计算排列不是检验零假设的有效方法,因为每个排列将具有不同的权重(概率/密度)。置换检验取决于将给定的一组数值分配给具有相同密度/概率的变量的每次分配。fXYZ(x=1,y=3,z=2)=fXYZ(x=3,y=2,z=1)

一个没有可交换性的具体例子:你有 N 个罐子,每个罐子里装着 100 张编号的票。前 M 个罐子的票只有 1-200 的奇数(每个数字 1 个票),其余 NM 的票只有 1-200 之间的偶数票。如果您从每个罐子中随机选择一张票,您将获得联名样本结果的分布。在这种情况下,f(X1=1,X2=2,X3=3...XN=N)f(X1=N,X2=N1,X3=N2...XN=1)

所以你不能只计算值 1 到 N 的排列。一般来说,当你的样本可以分成子组时,可交换性就会失败(就像我对罐子所做的那样)。如果您不是从 N 个罐子中抽取 1 个样本,而是从 1 个罐子中抽取 N 个样本,那么可交换性将会恢复。然后,联合分布对排列是不变的。