配对 t 检验的最小样本量是多少,如果数据是非正态的,什么是非参数等价物?

机器算法验证 重复测量 非参数 样本量 t检验 统计能力
2022-03-29 22:50:05

我有 4 个样本对,比如说 (x1, y1),...,(x4, y4)。

  • 配对 t 检验的最小样本量是多少?
  • 我应该检查配对 t 检验的哪个假设?
  • 如果我的数据是非正态的,什么是替代的非参数检验?
3个回答

对于如此小的样本量,正态性假设相当重要。如果您认为这个假设是错误的,您可以考虑使用 Wilcoxon 符号秩检验。

如果总体呈正态分布,则没有最小样本量。如果平均差异相对于总体方差很小,那么您的权力也将很小。但是,即使样本量非常小,也可以获得良好的功效。

例如,假设您的成对差异正态分布与(未知)方差σ2=1. 下面是蒙特卡洛估计(使用 10000 sims)对于递增值的功率0,.5,1,...,5平均成对差异

      Mean Difference  Power
 [1,]             0.0 0.0512
 [2,]             0.5 0.1097
 [3,]             1.0 0.2934
 [4,]             1.5 0.5250
 [5,]             2.0 0.7467
 [6,]             2.5 0.8975
 [7,]             3.0 0.9648
 [8,]             3.5 0.9925
 [9,]             4.0 0.9976
[10,]             4.5 0.9998
[11,]             5.0 0.9999

所以我们可以看到配对是可能的t- 当平均差异与差异的方差相比相当大(在这种情况下至少是 2 倍)时,测试仍然具有良好的功效,即使n=4. 请记住,如果差异不是正态分布的,这一切都会直接出现在窗口之外。

如果您喜欢使用下面的 R 代码,您可以查看这些幂的平均差和方差的其他值(注意:t- 测试什么时候n=4使用通常的 0.05 截止值是 3.182446。假设要测试的空值是 0)。

U=seq(0,5,by=.5)
V=U-U
sig=1

for(k in 1:11)
{
   Z=rep(0,10000)
   for(i in 1:10000)
   {
      diffs=rnorm(4,mean=U[k], sd=sig)
      z=(mean(diffs)-0)/(sd(diffs)/sqrt(4))
      Z[i]=z
   }
   V[k] = mean(abs(Z)>3.182446)
}
X=cbind(U,V)
colnames(X)=c("Mean Difference", "Power")
X

t 检验没有最小样本量。但是正如@shabbychef 指出的那样,您将拥有很少的权力。

配对 t 检验的最小样本量是多少?

一般来说,对于普通的配对 t 检验,两对是最小的,产生 1 df

我应该检查配对 t 检验的哪个假设?

通常情况下,我会尝试评估所有这些,但如果你只有 4 双,那么尝试几乎没有希望。您有四个对差异,其中两个 df 将用于估计差异的均值和方差(位置和规模与假设无关),本质上留下两个 df 来评估变化的方差、依赖性(以任何形式发生给你寻找,如果有的话)和正常。

如果我的数据是非正态的,什么是替代的非参数检验?

配对数据:Wilcoxon 符号秩检验;或签名测试;或任意数量的排列测试或引导测试(取决于您如何构建统计数据/您想要测试的具体内容)。当然,所有这些仍然有假设。

但是 t 检验至少对差异的轻度非正态性(以及应该是正常的差异)具有相当的鲁棒性。如果观察结果是轻度右偏且不是很重尾,那么即使在大样本量下,差异也可能与正常无法区分。也就是说,如果非正态性是主要问题,则没有什么理由避免使用带符号的秩检验,但是如果有 4 对,那么您几乎会陷入 12.5% 的显着性水平