机器算法验证 - 具有相关数据的 Kolmogorov-Smirnov 检验 - 吾爱随笔录

机器算法验证 kolmogorov-smirnov 测试

2022-03-18 16:33:36

假设我有 100 个学生，每个学生有 2 个分数：阅读分数和写作分数，所以基本上我会有 2 个向量，每个向量的长度都是 100。

我想测试阅读分数和写作分数的分布是否相同，所以我想使用 Kolmogorov-Smirnov 测试，但是可以使用依赖数据运行测试吗？

3个回答

Kolmogorov-Smirnov 检验仅在样本独立时使用。但是，在这里您可以找到一个以置换测试（在 R 中）形式完成工作的脚本。

Kolmogorov-Smirnov 检验是为两个独立样本设计的。您需要对成对观察进行测试。我认为没有人曾提出过用于配对观察的 KS 测试模拟。而且，这是一个非常谨慎的测试，即在很多情况下它的功率都很低。

我建议进行配对非参数检验，无论是符号检验还是 Wilcoxon 符号秩检验，都基于每个科目的两个分数之间的差异。后者更常见，并且对于具有正态分布和广泛非正态分布的观察具有强大的功效。

如果这两个度量是强相关的，那么符号检验可能会非常强大，可能比 Wilcoxon 符号秩检验更强大。两种检验都基于观察的排列：Wilcoxon 符号秩检验的符号差异和符号检验的差异符号。

弗里德曼检验通常用于三个或更多测量。如果只有两个测量值，它会给出与 Wilcoxon 检验相同的 p 值结果。

我相信你需要的是一个(Related-Samples) Friedman's Two-way Analysis of Variance by Ranks（见这个）。它带有一对关于您正在比较的分布的零假设，您可以根据 p 值拒绝/保留：

或者如 (2) 中所述：“对于 Friedman 的按等级进行的双向方差分析，原假设表明 K 个重复测量或匹配组来自同一人群或来自具有相同中位数 (1) 的人群。在零假设，检验假设响应变量具有相同的潜在连续分布； "

与 R 不太相关，但上述测试也是 IBM 在 (v24) SPSS 统计包中提供的，用于测试是否从同一人群中抽取了 k 个相关样本（请参阅IBM SPSS v24 文档）：

"比较分布。弗里德曼的 2-way ANOVA 按等级（k 个样本）生成一个相关样本测试，以确定 k 个相关样本是否来自同一总体。您可以选择请求对 k 个样本进行多重比较，或者所有成对多重比较或逐步降压比较。”

参考

(1) 西格尔，S. (1956)。行为科学的非参数统计。
(2) Pereira, DG, Afonso, A., & Medeiros, FM (2015)。弗里德曼检验和事后分析概述。统计模拟和计算中的通信，44（10），2636-2653。

其它你可能感兴趣的问题