两样本单面 Kolmogorov-Smirnov 检验与单面 Wilcoxon-Mann-Whitney 检验

机器算法验证 r 非参数 序数数据
2022-03-30 15:36:45

我已经阅读了图书馆手册以进行ks.test测试

Alternative的可能值“two.lateral”、“less”和“greater”指定了x的真实分布函数等于、不小于或不大于假设分布函数的原假设(单样本情况)或 y 的分布函数(两个样本情况)。这是累积分布函数的比较,检验统计量是值的最大差异,“更大”替代方案中的统计量是 D^+ = max[F_x(u) - F_y(u)]。因此,在两个样本情况下,alternative = "greater" 包括 x 随机小于 y 的分布(x 的 CDF 位于 y 的上方,因此位于 y 的左侧),与 t.test 或 wilcox.test 不同.

不幸的是,我无法理解(我猜是一方面)wilcox.testks.test. 似乎,两者都测试了一种分布与另一种分布的位移。请问有人可以解释一下吗?

2个回答

两者都在测试 x 变量相对于 y 变量的位移,但是对于术语“更大”(因此也或“更少”),这两个测试具有相反的含义。

ks.test“更大”中意味着“x”的 CDF 高于“y”的 CDF,这意味着如果“x”的 CDF 和“y”中的平均值和中位数之类的值将小于“y”中的值x'比'y'的CDF“更大”。在 'wicox.test' 和 't.test' 中,如果您认为“更大”的替代方案是正确的,那么 'x' 中的平均值、中位数等将大于 'y' 中的平均值。

R中的一个例子:

> x <- rnorm(25)
> y <- rnorm(25, 1)
> 
> ks.test(x,y, alt='greater')

        Two-sample Kolmogorov-Smirnov test

data:  x and y 
D = 0.6, p-value = 0.0001625
alternative hypothesis: two-sided 

> wilcox.test( x, y, alt='greater' )

        Wilcoxon rank sum test

data:  x and y 
W = 127, p-value = 0.9999
alternative hypothesis: true location shift is greater than 0 

> wilcox.test( x, y, alt='less' )

        Wilcoxon rank sum test

data:  x and y 
W = 127, p-value = 0.000101
alternative hypothesis: true location shift is less than 0 

在这里,我从正态分布中生成了 2 个样本,样本大小均为 25,标准差为 1。x变量来自均值 0 的分布,y变量来自均值 1 的分布。您可以看到ks.test给出的结果非常显着结果在“更大”方向上进行测试,即使x平均值较小,这是因为 的 CDFx高于 的ywilcox.test函数在“更大”方向上显示缺乏显着性,但在“更少”方向上具有相似的显着性水平。

两种测试都是测试相同想法的不同方法,但是 2 种测试的“更大”和“更少”的含义是不同的(并且在概念上是相反的)。

在这一点上,我不同意 R 和@GregSnow。这就是为什么。

set.seed(123)
x <- rnorm(25)
y <- rnorm(25, sd=5)
ks.test(x, y, alternative='greater')
#    Two-sample Kolmogorov-Smirnov test
#
# data:  x and y
# D^+ = 0.44, p-value = 0.007907
# alternative hypothesis: the CDF of x lies above that of y
#
ks.test(x, y, alternative='less')
#    Two-sample Kolmogorov-Smirnov test
#
# data:  x and y
# D^- = 0.36, p-value = 0.03916
# alternative hypothesis: the CDF of x lies below that of y

在方差不同的情况下, 的 CDFx位于 的之上和之下y因此,拒绝片面假设并不意味着平均值或中位数。它甚至没有提到随机优势

您可以在此处找到有关此误解的更多信息,并此处进行一些讨论在我看来,单边KS测试具有一定的理论吸引力,但从它得出关于第一时刻的结论是错误的。为此,Wilcoxon 检验更为合适。