这是 Frank Harrell 在这里写的后续问题:
根据我的经验,t 分布准确所需的样本量通常大于手头的样本量。正如你所说,Wilcoxon 符号秩检验非常有效,而且它很健壮,所以我几乎总是更喜欢它而不是 t 检验
如果我理解正确 - 在比较两个不匹配样本的位置时,如果我们的样本量很小,我们更愿意使用 Wilcoxon 秩和检验而不是非配对 t 检验。
是否存在我们更喜欢 Wilcoxon 秩和检验而不是非配对 t 检验的理论情况,即使我们两组的样本量相对较大?
我对这个问题的动机源于观察到,对于单个样本 t 检验,将其用于偏态分布的不太小的样本会产生错误的 I 类错误:
n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572 # "wrong" type I error