我有 4 个样本对,比如说 (x1, y1),...,(x4, y4)。
- 配对 t 检验的最小样本量是多少?
- 我应该检查配对 t 检验的哪个假设?
- 如果我的数据是非正态的,什么是替代的非参数检验?
我有 4 个样本对,比如说 (x1, y1),...,(x4, y4)。
对于如此小的样本量,正态性假设相当重要。如果您认为这个假设是错误的,您可以考虑使用 Wilcoxon 符号秩检验。
如果总体呈正态分布,则没有最小样本量。如果平均差异相对于总体方差很小,那么您的权力也将很小。但是,即使样本量非常小,也可以获得良好的功效。
例如,假设您的成对差异正态分布与(未知)方差. 下面是蒙特卡洛估计(使用 10000 sims)对于递增值的功率平均成对差异
Mean Difference Power
[1,] 0.0 0.0512
[2,] 0.5 0.1097
[3,] 1.0 0.2934
[4,] 1.5 0.5250
[5,] 2.0 0.7467
[6,] 2.5 0.8975
[7,] 3.0 0.9648
[8,] 3.5 0.9925
[9,] 4.0 0.9976
[10,] 4.5 0.9998
[11,] 5.0 0.9999
所以我们可以看到配对是可能的- 当平均差异与差异的方差相比相当大(在这种情况下至少是 2 倍)时,测试仍然具有良好的功效,即使. 请记住,如果差异不是正态分布的,这一切都会直接出现在窗口之外。
如果您喜欢使用下面的 R 代码,您可以查看这些幂的平均差和方差的其他值(注意:- 测试什么时候使用通常的 0.05 截止值是 3.182446。假设要测试的空值是 0)。
U=seq(0,5,by=.5)
V=U-U
sig=1
for(k in 1:11)
{
Z=rep(0,10000)
for(i in 1:10000)
{
diffs=rnorm(4,mean=U[k], sd=sig)
z=(mean(diffs)-0)/(sd(diffs)/sqrt(4))
Z[i]=z
}
V[k] = mean(abs(Z)>3.182446)
}
X=cbind(U,V)
colnames(X)=c("Mean Difference", "Power")
X
t 检验没有最小样本量。但是正如@shabbychef 指出的那样,您将拥有很少的权力。
配对 t 检验的最小样本量是多少?
一般来说,对于普通的配对 t 检验,两对是最小的,产生 1 df
我应该检查配对 t 检验的哪个假设?
通常情况下,我会尝试评估所有这些,但如果你只有 4 双,那么尝试几乎没有希望。您有四个对差异,其中两个 df 将用于估计差异的均值和方差(位置和规模与假设无关),本质上留下两个 df 来评估变化的方差、依赖性(以任何形式发生给你寻找,如果有的话)和正常。
如果我的数据是非正态的,什么是替代的非参数检验?
配对数据:Wilcoxon 符号秩检验;或签名测试;或任意数量的排列测试或引导测试(取决于您如何构建统计数据/您想要测试的具体内容)。当然,所有这些仍然有假设。
但是 t 检验至少对差异的轻度非正态性(以及应该是正常的差异)具有相当的鲁棒性。如果观察结果是轻度右偏且不是很重尾,那么即使在大样本量下,差异也可能与正常无法区分。也就是说,如果非正态性是主要问题,则没有什么理由避免使用带符号的秩检验,但是如果有 4 对,那么您几乎会陷入 12.5% 的显着性水平