我对 ks.test (package stat) a) 在存在领带的情况下的行为感到困惑,并且 b) 如果在进行两个样本测试时偏向一边。文档:“如果单边或存在关系,则两个样本情况下的精确 p 值不可用。”
我问黑色(实验)和红色(对照)是否遵循相同的分布函数而不知道底层分布函数。
在我手中,如果单边且存在平局(根据警告消息),则会计算出精确的 p 值。但是两侧的 p 值只是 < 2.2e-16,但不是“完全”报告的。
如果有兴趣,您可以将数据下载为 .Rda(向量长度 ~ 9000):
https://www.dropbox.com/s/xl29jvpurkbwqpm/black.Rda?dl=0
https://www.dropbox.com/s/5biptm1xet36v3v/red.Rda?dl=0
例子:
ks.test (black, red)
Two-sample Kolmogorov-Smirnov test
data: black and red
D = 0.0731, p-value < 2.2e-16
alternative hypothesis: two-sided
ks.test (black, red)$p.value
[1] 0
Warnmeldung: # means warning message
In ks.test(black, red) :
im Falle von Bindungen sind die p-Werte approximativ # "Bindungen" means ties
ks.test (black, red, alternative="g")$p.value # not as expected
[1] 1.235537e-23
Warnmeldung:
In ks.test(black, red, alternative = "g") :
im Falle von Bindungen sind die p-Werte approximativ
ks.test (black, red, alternative="l")$p.value
[1] 0.0005651143
Warnmeldung:
In ks.test(black, red, alternative = "l") :
im Falle von Bindungen sind die p-Werte approximativ
我尝试ks.boot
了(包“Matching”),它声称适用于带关系的两个.sample 测试,并且“即使在被比较的分布不完全连续的情况下也能提供正确的覆盖率”。相同的故事。我只得到了单方面条件的精确 p 值。例如:
ks.boot (black, red, alternative="l")
$ks.boot.pvalue
[1] 0.001
$ks
Two-sample Kolmogorov-Smirnov test
data: Tr and Co
D^- = 0.0275, p-value = 0.0005651
alternative hypothesis: the CDF of x lies below that of y
$nboots
[1] 1000
attr(,"class")
[1] "ks.boot"
我是否误解了这句话“如果单边或存在关系,则两个样本的情况下无法获得精确的 p 值?” 我认为感觉是:如果单边或......没有确切的p值
ks.test (two.sample, one side) 的 p 值是否“正确”?
在提供精确的 p 值方面,ks.boot 并不优越。
有人可以对此发表评论吗?谢谢赫尔曼
@Roland我的问题:“如果单边或存在联系,则两个样本情况下的精确p值不可用”(ks.test)。也许我对(统计)方法定义的“精确”一词感到困惑。但是我得到了单边的“精确”(在精确数字的意义上)p值,而不是双边测试的p值......
ks.test (black, red, alternative="g")$p.value # one-sided
[1] 1.235537e-23 # precise p-value
Warnmeldung:
In ks.test(black, red, alternative = "g") :
im Falle von Bindungen sind die p-Werte approximativ
ks.test(black, red)$p.value # two.sided
[1] 0 # Is this precise?
最“精确”的 p 值(ks.test,two.lateral)...
ks.test (black, red)
Two-sample Kolmogorov-Smirnov test
data: black and red
D = 0.0731, p-value < 2.2e-16
alternative hypothesis: two-sided
Warnmeldung:
In ks.test(black, red) :
im Falle von Bindungen sind die p-Werte approximativ
我很困惑,如果 p.value < 2.2e-16 (two.lateral, ks.test) 会报告 p 值为 0。这很可能与“精确” p.values 没有任何关系。所以答案可能是:这些是近似的 p.values(根据文档,因为存在联系,而且是片面的)。但这并不能解释根据报告的 p 值的不同行为。我得到一个“精确”(近似)p.value 单面但不是双面......由于统计原因?
此外,我也没有得到双向 ks.boot 的“精确” p 值(应该是“精确的”)。它是 < 2.2e-16 并且 ks.boot.pvalue 再次为 0。那么对于双向测试,“准确”的 ks.boot.pvalue 在哪里?ks.test 只有 p.value。
ks.boot (black, red)
$ks.boot.pvalue [1] 0 # 没有 ks.boot.pvalue 报告
$ks
Two-sample Kolmogorov-Smirnov test
data: Tr and Co
D = 0.0731, p-value < 2.2e-16
alternative hypothesis: two-sided
$nboots
[1] 1000
attr(,"class")
[1] "ks.boot"
“精确” p 值(ks.boot)是否仅针对单面条件报告?
谢谢赫尔曼