我有两组。根据 KW 检验,存在显着差异。但是我需要报告组的平均值或中位数吗?
使用 Kruskal-Wallis 检验时,我们是否需要报告中位数或平均值?
机器算法验证
克鲁斯卡尔-沃利斯测试
报告
2022-03-18 19:52:18
2个回答
Wilcoxon/Kruskal-Wallis 检验不适用于均值或中值,尽管中值可能更接近测试的结果。与检验一致的估计量是 Hodges-Lehmann 估计量。请参阅http://en.wikipedia.org/wiki/Mann-whitney和http://en.wikipedia.org/wiki/Hodges%E2%80%93Lehmann_estimate。在 R 中,您可以轻松地进行计算 - 参见例如http://biostat.mc.vanderbilt.edu/WilcoxonSoftware。
据说 Kruskal-Wallis 检验可以检验每个组的中位数是否相同。根据这个简单的规则,你应该报告中位数,这是我对你问题的回答。
然而,这让我有机会证明 KW 并不是真正的中位数检验。检验的备择假设不是其中一个分布具有不同的中位数。这是一个分布与其他分布具有完全相同的形状,但向上或向下移动。
这是一个小的 R 代码片段来演示这一点。我创建了两个具有相同中位数(即 0)的样本,并应用了 Kruskal-Wallis 检验。
set.seed(123)
x <- exp(rnorm(100))
y <- exp(rnorm(100))
x <- x - median(x)
y <- median(y) - y
# Both x and y have median 0.
kruskal.test(list(x,y))
事实证明,p 值为 0.005676,对于具有完全相同中位数的两个样本,这似乎非常低。这是因为样本取自在相反方向上非常偏斜的分布(样本x在右侧和y左侧都有很重的尾巴)。
KW测试错了吗?不,拒绝样本取自同一分布的原假设是正确的。
所以结论是你不能仅仅因为你拒绝原假设就得出中位数存在差异的结论。您也可能因为缺乏独立性而拒绝原假设,或者如前面的示例所示,因为分布不具有相同的形状。
我认为在报告中位数时没有必要提及所有这些,但这些是您每次进行测试时都应该牢记的元素。
其它你可能感兴趣的问题