在什么情况下,Wilcoxon 的符号秩检验优于 t 检验或符号检验?

机器算法验证 假设检验 t检验 配对数据 威尔克森符号秩 符号测试
2022-03-24 10:02:36

经过一些讨论(如下),我现在对一个重点问题有了更清晰的了解,所以这里有一个修改后的问题,尽管现在有些评论似乎与原始问题无关。

似乎t 检验对于对称分布收敛很快符号秩检验假设对称,对于对称分布,均值/伪中位数/中位数之间没有区别。如果是这样,在什么情况下,相对缺乏经验的统计学家会发现符号秩检验有用,当他/她同时有 t 检验和符号检验可用时?如果我的一个(例如社会科学)学生试图测试一种治疗方法是否比另一种治疗效果更好(通过一些相对容易解释的测量方法,例如一些“平均”差异的概念),我正在努力寻找一个地方来签署 -排名测试,尽管在我的大学似乎普遍教授,而符号测试被忽略了。

1个回答

考虑一个比正常的重尾分布,但不是特别“尖峰”的配对差异分布;那么通常符号秩检验往往会比 t 检验更强大,但也比符号检验更强大。

例如,在逻辑分布上,带符号秩检验相对于 t 检验的渐近相对效率为 1.097,因此带符号秩检验应该比 t 更强大(至少在较大的样本中),但渐近相对效率相对于 t 检验的符号检验的系数为 0.822,因此符号检验的效力不如 t(同样,至少在较大的样本中)。

随着我们转向重尾分布(同时仍然避免过度尖峰分布),t 的表现往往会相对较差,而符号测试应该会有所改善,并且符号和符号秩在检测小显着的影响(即需要更小的样本量来检测影响)。将有一大类分布,其中带符号秩检验是三者中最好的。

这是一个例子——t3分配。对于三个测试,在 n = 100 时模拟功率,显着性水平为 5%。权力为t测试标记为黑色,Wilcoxon 符号等级标记为红色,符号测试标记为绿色。符号检验的可用显着性水平不包括任何特别接近 5% 的值,因此在这种情况下,使用随机检验来接近正确的显着性水平。x轴是δ代表从零情况偏移的参数(测试都是双边的,因此实际功率曲线将关于 0 对称)。

t 的功效曲线图,Wilcoxon 符号秩和符号检验,n=100 和 t3 的 5% 显着性水平

正如我们在图中看到的,符号秩检验比符号检验具有更大的功效,而符号检验又比 t 检验具有更大的功效。