对于不等均值,Mann-Whitney U 检验如何返回 ap = 1.00?

机器算法验证 p 值 wilcoxon-mann-whitney 检验
2022-04-12 15:06:17

我想比较大小不等的两组(G1 = 78;G2 = 23)之间的反应时间任务得出的分数。但是,当我运行 U 测试时,它告诉我没有显着差异,U = 897.00,z = .000,P = 1.00。当平均值之间至少存在一些差异(0.21 与 0.20)时,我如何获得 1.00 的显着性?我原以为没有区别,但这些统计数据与我从 t 检验得到的不同。我正在运行 U 检验来解释几个不同变量的不等组大小和非正态数据,但是 0.000 的 z 统计量和 1.00 的 P 值是否准确报告?

提前致谢。

2个回答

对于不等均值,Mann-Whitney U 检验如何返回 ap = 1.00?

因为这不是手段测试。

我想比较大小不等的两组(G1 = 78;G2 = 23)之间的反应时间任务得出的分数。但是,当我运行 U 测试时,它告诉我没有显着差异,U = 897.00,z = .000,P = 1.00。当平均值之间至少存在一些差异(0.21 与 0.20)时,我如何获得 1.00 的显着性?

因为它不比较手段!(它也没有比较中位数,尽管许多书另有说法)

尽管均值的差异与 0 略有不同,但 Mann-Whitney 所看到的*结果却是 0。

* 无论是根据平均排名还是作为两个样本的 Hodges-Lehmann 差异来构思。

(例如,请参阅此答案

我原以为没有区别,但这些统计数据与我从 t 检验得到的不同。

如果它们始终相同,则您不需要两个不同的测试。

我正在运行 U 检验来解释几个不同变量的不等组大小和非正态数据,但是 0.000 的 z 统计量和 1.00 的 P 值是否准确报告?

我不确定您所说的“准确”是什么意思,但我只想报告这些数字;他们当然是可能的。

Mann-Whitney U 检验是一种非参数检验,松散地说,它是对排名的命中和未命中进行计数,其要点是结果的数量是可数的,而不是像t量那样的真实连续性。通过一些简化,结果的数量是对象的组合数,一次取两个,在实践中,其中一些组合产生这样做是为了限制 U 统计量可以输出的可能概率值的数量,使得完美的仅仅意味着在可计数事件匹配时没有检测到差异。 1tn(n+1)2np=1p=1p=1是一个偶然的结果,也就是说,它与确定性系统中的含义并不相同,甚至被怀疑是确定性系统都会遭受黑天鹅问题也就是说,仅仅因为只看到白天鹅的概率可能看起来像,并不能使该估计值适用于更大的数据集。也就是说,将系统称为确定性系统需要一个坚实的物理理由,而仅凭猜测无法提供这一点。事实上,Mann-Whitney U 检验的结果是可数的,每个结果只是近似的。p=1

忍不住注意到上面的讨论。这是 Mann-Whitney U 检验的一个工作示例在该文件中,可以看到 Mann-Whitney U 检验使用相当全面的排名比较来测试数据集位置的差异。数据位置的概念比平均值或中位数更普遍。数据位置的最佳度量可以被认为是数据位置MVUE的最小方差无偏估计。例如,对于未知总体端点的均匀分布,x 的平均极值\frac{min(x)+max (min(x)+max(x)2x-values 是比均值或中位数更低的位置方差估计量,尽管事实上对于均匀分布,随着观察次数无限增加,所有三个测量值都趋向于同一位置。

Mann-Whitney U 检验最重要的特点是它是对位置差异的无偏检验,因为它忽略了非正态性。最后,Mann-Whitney U 检验的位置测量差异是……等等……U 统计量。

U 统计理论允许从用于大类概率分布的可估计参数(或者统计泛函)的每个无偏估计量中导出最小方差无偏估计量。如果, U 统计量是平均成对偏差 ,为定义。该理论解释说,U 统计量是数据三元组中位数的 MVUE,而不是数据样本的中位数。f(x1,x2)=|x1x2|fn(x1,,xn)=ij|xixj|/(n(n1))n2n