了解 Kruskal-Wallis post hoc 中的警告消息“Ties are present”

机器算法验证 r 领带
2022-03-18 19:49:12

我在 Kruskal-Wallis 测试后进行事后比较。我正在使用PMCMR包。

> posthoc.kruskal.nemenyi.test( preference ~ instrument)

    Pairwise comparisons using Tukey and Kramer (Nemenyi) test  
                   with Tukey-Dist approximation for independent samples 

data:  preference by instrument 

       Cello Drums Guitar
Drums  0.157 -     -     
Guitar 0.400 0.953 -     
Harp   0.013 0.783 0.458 

P value adjustment method: none 

Warning message:
In posthoc.kruskal.nemenyi.test.default(c(50L, 50L, 50L, 50L, 49L,  :
  Ties are present, p-values are not corrected.

我对警告信息感到困惑。谁能解释它的含义以及我如何纠正它?

1个回答

平局意味着您有多个观察值共享相同的值(因此排名相同)。例如,一个样本由观察组成:1,3,3,5,10,10,10. "3“ 和 ”10" 是两个关系,其中3有复制品210有复制品3. 这样的样本对应于秩统计:1,2,2,4,5,5,5.

当存在关系时,通常我们需要打破它(如果没有,您可能会收到如您所展示的警告消息)。传统上,我们打破等级统计的关系,而不是在原始观察中打破关系。由于 Kruskal-Wallis 检验使用排名统计,因此通过将范围限制为排名统计来回答您的问题就足够了。

常用的破局方法有两种,一种是“随机破局”。即,我们在关系中随机重新生成不同的等级。继续上面的例子,到 tie "2,2",我们可以从集合中抽取两个没有替换的数字{2,3},然后将它们分配到第二个和第三个位置,例如“3, 2”。同样,我们可以对领带这样做10. 一个可能的调整排名统计可以是1,3,2,4,6,5,7,因此关系破裂。这种方法的缺点是你可能会在不同的分析中得到不同的测试统计,因为平局是随机的。

第二种方法是“平均”。也就是说,average 为每个并列元素分配“平均”等级。使用这种方法,原始排名统计变为:1,2.5,2.5,4,6,6,6. 这种方法本质上是调整关系而不是打破它们。

在软件中,您可以指定打破平局的选项,您应该查阅函数文档。

有关此问题的类似讨论,请参阅R 的 rank 函数的 ties.method 参数如何工作?