中位数差异与中位数差异的假设检验

机器算法验证 假设检验 引导程序 中位数 群体差异
2022-03-18 15:31:03

我发现这篇文章说应该测试中位数差异而不是中位数差异,特别是如果数据有偏差:http: //onbiostatistics.blogspot.com/2015/12/median-of-differences-versus- difference.html作者说“差异的中位数是要使用的正确数字,是与签名等级测试相对应的数字”。

我没有找到很好的解释。我的问题:从统计角度来看,为什么中位数差异应该优于中位数差异?

提供更多背景知识:差异是成对的。此外,配对差异高度向右倾斜(在我的真实数据集中),这就是我想使用引导假设检验的原因。


例子

假设我有两个样本 x1 和 x2,如下所示。样本是成对的,例如id可以指定人并且x1可以是干预之前和干预x2之后的测量(对于同一个人)。

id    x1      x2    difference
1   1.37    1.68    -0.31   
2   2.18    2.99    -0.80   
3   1.16    3.24    -2.07   
4   3.60    3.08    0.52    
5   2.33    2.19    0.13    

中位数差异为:中位数(x1 - x2)= 中位数(差异)= -0.31

中位数的差异为:中位数(x1) - 中位数(x2) = -0.80。

1个回答

数据。您的数据表中存在一些细微差异(可能来自四舍五入)。下表是我输入您的 x1 和 x2 得到的结果。这些是我将使用的值:

       x1   x2     d
[1,] 1.37 1.68 -0.31
[2,] 2.18 2.99 -0.81
[3,] 1.16 3.24 -2.08
[4,] 3.60 3.08  0.52
[5,] 2.33 2.19  0.14

样本均值和中位数表现不同。这里需要讨论的原因是样本均值和样本中位数的行为方式截然不同。

表示:如果其中条形表示样本均值。Di=X1iX2i,D¯=X¯1X¯2,

中位数:但是,对于您的数据,可能有其中波浪号表示样本中位数。D~X~1X~2,

配对 Wilcoxon 检验。在您的链接中提出的观点是,配对 Wilcoxon 检验本质上是一个关于差异的单样本带符号秩检验。

因此,您从以下涉及中位数的两个测试中得到相同的结果。(我正在使用 R。)

关于差异的单样本 Wilcoxon 检验。

wilcox.test(d)

    Wilcoxon signed rank test

data:  d
V = 4, p-value = 0.4375
alternative hypothesis: true location is not equal to 0

配对 Wilcoxon 检验。

wilcox.test(x1, x2, paired=T)  # computes differences first

        Wilcoxon signed rank test

data:  x1 and x2
V = 4, p-value = 0.4375
alternative hypothesis: true location shift is not equal to 0

不正确的程序: 如果您在配对测试中忘记了参数“paired=T”,则 R 会执行 Mann-Whitney-Wilcoxon(秩和)双样本测试。P 值并没有太大的不同,但应该清楚的是,下面的测试不是配对测试。

wilcox.test(x1, x2)  # TWO-sample test, NOT PAIRED

        Wilcoxon rank sum test

data:  x1 and x2
W = 8, p-value = 0.4206
alternative hypothesis: true location shift is not equal to 0

配对数据的图形表示。出于同样的原因,如果你想显示成对数据的箱线图,你必须制作一个差异箱线图(如左图),而不是之前和之后的两个单独的箱线图。(在显示箱线图时,我假设您的实际数据有五个以上的主题。制作只有五个观察值的箱线图是不寻常的。)

在此处输入图像描述

混淆之前和之后的分数的单独条形图(点图),因为该图没有显示哪些之前的值与哪些之后的值配对。

在此处输入图像描述

您可以尝试连接数据点以显示对。

在此处输入图像描述

注意:只有五个科目,如您在问题中显示的数据,非参数 Wilcoxon 符号秩检验不会显示显着结果,除非所有五个差异都具有相同的符号。