置换检验的最小样本量

机器算法验证 假设检验 统计能力 置换检验
2022-03-29 23:42:29

我想知道是否有一种计算可以为我提供最小样本量,以实现置换检验的特定统计功效。我没有假设样本来自哪里的人口有任何参数分布。

我一直在寻找,但未能找到令人满意的答案。在大多数关于排列测试的文本中,统计能力似乎是一个被忽视的方面。

2个回答

你部分回答了你自己的问题。考虑一下您经常执行置换测试的原因。通常在您对任何特定参数分布没有信心或出于其他原因需要非参数解决方案的情况下。在那种情况下,如何估计功率?您可以在人口具有多峰分布、均匀分布、与您的条件不匹配的任何组合等情况下进行置换检验。所有这些都可能具有不同的幂函数。

请记住,估计功率的方式需要假设您知道效果大小效果分布的某个世界。由于您没有后者的概念,因此您无法先验地估计功率。您可以做的最好的事情是估计您可能认为接近的某些特定分布的功效,可能分布的子集,或者将您的数据作为总体。但后者让你知道除了事后获得权力的方法。

我敢打赌,置换测试会夸大小样本中的假阴性率。这是一个极端的例子来说明,但这也适用于不太极端的例子:

  • r=1,样本量为 4
  • 有4个!= 24 种排列

因此:至少1/24 (= .042) 排列将具有 r=1 所以p(r=1) >= 0.42这远远大于 r=1 的实际 p 值,实际上是 0。最糟糕的是,在 p 阈值为 0.01 的情况下,这个结果并不显着。这太疯狂了;r=1 是最重要的可能。

这是因为当您在现有值之间进行混洗时,您不会得到真正的空分布。现有值按顺序打乱,但不按值打乱。值本身是量化的。这些值有助于显着性。这可以并且将会使“空”随机分布偏向更重要的东西。这适用于小于 1 的极端 r 值,并且对于相关性以外的模型应该是正确的。