机器算法验证 - 如何测试两个（非正态）分布是否不同？ - 吾爱随笔录

机器算法验证 r 假设检验分布

2022-03-06 16:54:49

我已经阅读了有关学生 t 检验的信息，但是当我们可以假设原始分布是正态分布时，它似乎有效。就我而言，他们绝对不是。

另外，如果我有 13 个发行版，我需要做13^2测试吗？

这是两个分布的示例。有 13 个分布。

3个回答

“它取决于”有几种含义。

（一个潜在的担忧是原始数据看起来可能是离散的；应该澄清这一点。）

根据样本量，非正态性可能不像 t 检验那样大。至少对于大样本来说，通常具有良好的级别鲁棒性 - 如果 I 类错误率与正常情况相差不远，那么它应该不会受到太大影响。权力可能更多是一个沉重的尾巴问题。
如果您正在寻找任何类型的分布差异，则可能适合使用两样本拟合优度检验，例如两样本 Kolmogorov-Smirnov 检验（尽管可能会进行其他检验）。
如果您正在寻找位置族中的位置类型差异，或尺度族中的尺度差异，甚至只是 P(X>Y)>P(Y>X) 类型关系，Wilcoxon-Mann-Whitney两个样本测试可能是合适的。
如果您可以找到适合您想要敏感的差异类型的统计数据，您可以考虑重新采样测试，例如置换或引导测试。

另外，如果我有 13 个发行版，我需要进行 13^2 次测试吗？

嗯，没有。

首先，你不需要测试 $A$ 对比 $B$ 和 $B$ 对比 $A$ （第二个比较是多余的）。

其次，你不需要测试 $A$ 对比 $A$ .

这两件事将成对比较从 169 减少到 78。

第三，更常见（但不是强制性的）集体测试任何差异，然后，如果第一个空值被拒绝，则可能在事后成对测试中查看成对差异。

例如，代替上面第 3 项中的 Wilcoxon-Mann-Whitney，可以进行 Kruskal-Wallis 检验，该检验对组间位置的任何差异都很敏感。

Kolmogorov-Smirnov 检验也有k 样本版本，并且可能存在或正在构建其他一些两样本拟合优度检验的类似检验。

还有重采样检验和 t 检验的 k 样本版本（即 ANOVA，如果样本量相当大，这可能没问题）。

如果能获得更多关于我们正在处理的内容以及您最感兴趣的差异类型的信息，那就太好了；或失败，查看一些样本的 QQ 图。

是的，我认为你不能比测试每个发行版与其他发行版做得更好......

如果认为您的问题与此有关：Comparison of 2 distributions

您建议您使用 Kolmogorov-Sminorv 检验或 Cramér-Von Mises 检验。它们都是非常经典的充分性测试。

在stats 包中的R函数ks.test实现了第一个。第二个可以在像cramer.

“它用于比较两个以上独立或不相关的样本”

ANOVA 中的正态性违规在
Rutherford 介绍 Anova 和 Ancova：GLM 方法 9.1.2 正态性违规中进行了讨论

第一行是“尽管大多数消息来源都报告 ANOVA ......对于违反正态性假设的情况是稳健的......”

其它你可能感兴趣的问题