机器算法验证 - 配对 t 检验的最小样本量是多少，如果数据是非正态的，什么是非参数等价物？ - 吾爱随笔录

配对 t 检验的最小样本量是多少，如果数据是非正态的，什么是非参数等价物？

机器算法验证重复测量非参数样本量 t检验统计能力

2022-03-29 22:50:05

我有 4 个样本对，比如说 (x1, y1),...,(x4, y4)。

配对 t 检验的最小样本量是多少？
我应该检查配对 t 检验的哪个假设？
如果我的数据是非正态的，什么是替代的非参数检验？

3个回答

对于如此小的样本量，正态性假设相当重要。如果您认为这个假设是错误的，您可以考虑使用 Wilcoxon 符号秩检验。

如果总体呈正态分布，则没有最小样本量。如果平均差异相对于总体方差很小，那么您的权力也将很小。但是，即使样本量非常小，也可以获得良好的功效。

例如，假设您的成对差异正态分布与（未知）方差 $\sigma^{2} = 1$ . 下面是蒙特卡洛估计（使用 10000 sims）对于递增值的功率 $0, .5, 1, ..., 5$ 平均成对差异

      Mean Difference  Power
 [1,]             0.0 0.0512
 [2,]             0.5 0.1097
 [3,]             1.0 0.2934
 [4,]             1.5 0.5250
 [5,]             2.0 0.7467
 [6,]             2.5 0.8975
 [7,]             3.0 0.9648
 [8,]             3.5 0.9925
 [9,]             4.0 0.9976
[10,]             4.5 0.9998
[11,]             5.0 0.9999

所以我们可以看到配对是可能的 $t$ - 当平均差异与差异的方差相比相当大（在这种情况下至少是 2 倍）时，测试仍然具有良好的功效，即使 $n=4$ . 请记住，如果差异不是正态分布的，这一切都会直接出现在窗口之外。

如果您喜欢使用下面的 R 代码，您可以查看这些幂的平均差和方差的其他值（注意： $t$ - 测试什么时候 $n=4$ 使用通常的 0.05 截止值是 3.182446。假设要测试的空值是 0)。

U=seq(0,5,by=.5)
V=U-U
sig=1

for(k in 1:11)
{
   Z=rep(0,10000)
   for(i in 1:10000)
   {
      diffs=rnorm(4,mean=U[k], sd=sig)
      z=(mean(diffs)-0)/(sd(diffs)/sqrt(4))
      Z[i]=z
   }
   V[k] = mean(abs(Z)>3.182446)
}
X=cbind(U,V)
colnames(X)=c("Mean Difference", "Power")
X

t 检验没有最小样本量。但是正如@shabbychef 指出的那样，您将拥有很少的权力。

配对 t 检验的最小样本量是多少？

一般来说，对于普通的配对 t 检验，两对是最小的，产生 1 df

我应该检查配对 t 检验的哪个假设？

通常情况下，我会尝试评估所有这些，但如果你只有 4 双，那么尝试几乎没有希望。您有四个对差异，其中两个 df 将用于估计差异的均值和方差（位置和规模与假设无关），本质上留下两个 df 来评估变化的方差、依赖性（以任何形式发生给你寻找，如果有的话）和正常。

如果我的数据是非正态的，什么是替代的非参数检验？

配对数据：Wilcoxon 符号秩检验；或签名测试；或任意数量的排列测试或引导测试（取决于您如何构建统计数据/您想要测试的具体内容）。当然，所有这些仍然有假设。

但是 t 检验至少对差异的轻度非正态性（以及应该是正常的差异）具有相当的鲁棒性。如果观察结果是轻度右偏且不是很重尾，那么即使在大样本量下，差异也可能与正常无法区分。也就是说，如果非正态性是主要问题，则没有什么理由避免使用带符号的秩检验，但是如果有 4 对，那么您几乎会陷入 12.5% 的显着性水平

其它你可能感兴趣的问题

上一篇测试以比较用户界面下一篇可以使用哪些方法从数据中指定先验？