Wilcoxon 符号排序检验告诉我们配对数据之间的中值差异是否可以为零。通过计算统计量、z 分数并将其与临界值进行比较来执行测试。
令我震惊的是,我们
从计算统计量的过程中丢弃所有具有相同值的对。
从维基百科我们在第2步:
排除对 。令为减少的样本量。
在其余的计算中只
引用的消息来源之一说:
在 Wilcoxon 过程的大多数应用中,此时将和之间的差异为零的情况排除在考虑之外,因为它们没有提供有用的信息,然后将剩余的绝对差异从最低到最高排序,并列在适当的地方包括等级。
然后作者继续以与 Wikipedia 文章中相同的方式进行计算。
我试图查看原始Wilcoxon 的文章,但他似乎没有提到相同的值对。
我认为这是疯狂的原因是:
好的,相同的值对不会改变统计数据的值,但它们会改变 z-score。想象一下有对的样本,而在对中,第二个值更高,而在所有剩余的对中,值相同。根据上面提到的文章,我们应该丢弃这对,因为它们“没有提供有用的信息”,只考虑剩下的对。但是那对确实提供了有用的信息。他们尖叫着支持零假设。
拜托,你能解释一下如何正确地进行测试吗?