机器算法验证 - 对于不等均值，Mann-Whitney U 检验如何返回 ap = 1.00？ - 吾爱随笔录

对于不等均值，Mann-Whitney U 检验如何返回 ap = 1.00？

机器算法验证 p 值 wilcoxon-mann-whitney 检验

2022-04-12 15:06:17

我想比较大小不等的两组（G1 = 78；G2 = 23）之间的反应时间任务得出的分数。但是，当我运行 U 测试时，它告诉我没有显着差异，U = 897.00，z = .000，P = 1.00。当平均值之间至少存在一些差异（0.21 与 0.20）时，我如何获得 1.00 的显着性？我原以为没有区别，但这些统计数据与我从 t 检验得到的不同。我正在运行 U 检验来解释几个不同变量的不等组大小和非正态数据，但是 0.000 的 z 统计量和 1.00 的 P 值是否准确报告？

提前致谢。

2个回答

对于不等均值，Mann-Whitney U 检验如何返回 ap = 1.00？

因为这不是手段测试。

我想比较大小不等的两组（G1 = 78；G2 = 23）之间的反应时间任务得出的分数。但是，当我运行 U 测试时，它告诉我没有显着差异，U = 897.00，z = .000，P = 1.00。当平均值之间至少存在一些差异（0.21 与 0.20）时，我如何获得 1.00 的显着性？

因为它不比较手段！（它也没有比较中位数，尽管许多书另有说法）

尽管均值的差异与 0 略有不同，但 Mann-Whitney 所看到的*结果却是 0。

* 无论是根据平均排名还是作为两个样本的 Hodges-Lehmann 差异来构思。

（例如，请参阅此答案）

我原以为没有区别，但这些统计数据与我从 t 检验得到的不同。

如果它们始终相同，则您不需要两个不同的测试。

我正在运行 U 检验来解释几个不同变量的不等组大小和非正态数据，但是 0.000 的 z 统计量和 1.00 的 P 值是否准确报告？

我不确定您所说的“准确”是什么意思，但我只想报告这些数字；他们当然是可能的。

Mann-Whitney U 检验是一种非参数检验，松散地说，它是对排名的命中和未命中进行计数，其要点是结果的数量是可数的，而不是像t量那样的真实连续性。通过一些简化，结果的数量是或对象的组合数，一次取两个，在实践中，其中一些组合产生。这样做是为了限制 U 统计量可以输出的可能概率值的数量，使得完美的仅仅意味着在可计数事件匹配时没有检测到差异。 1 $t$ $\frac{n(n+1)}{2}$ $n$ $p=1$ $p=1$ $p=1$ 是一个偶然的结果，也就是说，它与确定性系统中的含义并不相同，甚至被怀疑是确定性系统都会遭受黑天鹅问题。也就是说，仅仅因为只看到白天鹅的概率可能看起来像，并不能使该估计值适用于更大的数据集。也就是说，将系统称为确定性系统需要一个坚实的物理理由，而仅凭猜测无法提供这一点。事实上，Mann-Whitney U 检验的结果是可数的，每个结果只是近似的。 $p=1$

忍不住注意到上面的讨论。这是 Mann-Whitney U 检验的一个工作示例。在该文件中，可以看到 Mann-Whitney U 检验使用相当全面的排名比较来测试数据集位置的差异。数据位置的概念比平均值或中位数更普遍。数据位置的最佳度量可以被认为是数据位置MVUE的最小方差无偏估计。例如，对于未知总体端点的均匀分布，x 的平均极值\frac{min(x)+max ( $\frac{min(x)+max(x)}{2}$ $x$ -values 是比均值或中位数更低的位置方差估计量，尽管事实上对于均匀分布，随着观察次数无限增加，所有三个测量值都趋向于同一位置。

Mann-Whitney U 检验最重要的特点是它是对位置差异的无偏检验，因为它忽略了非正态性。最后，Mann-Whitney U 检验的位置测量差异是……等等……U 统计量。

U 统计理论允许从用于大类概率分布的可估计参数（或者统计泛函）的每个无偏估计量中导出最小方差无偏估计量。如果, U 统计量是平均成对偏差，为定义。该理论解释说，U 统计量是数据三元组中位数的 MVUE，而不是数据样本的中位数。 $f(x_1, x_2) = |x_1 - x_2|$ $f_n(x_1,\ldots, x_n) = \sum_{i\neq j} |x_i - x_j| / (n(n-1))$ $n\ge 2$ $n$

其它你可能感兴趣的问题

上一篇使用非数字特征下一篇如果样本数等于参数数加一，我如何计算 AICc