具有相关数据的 Kolmogorov-Smirnov 检验

机器算法验证 kolmogorov-smirnov 测试
2022-03-18 16:33:36

假设我有 100 个学生,每个学生有 2 个分数:阅读分数和写作分数,所以基本上我会有 2 个向量,每个向量的长度都是 100。

我想测试阅读分数和写作分数的分布是否相同,所以我想使用 Kolmogorov-Smirnov 测试,但是可以使用依赖数据运行测试吗?

3个回答

Kolmogorov-Smirnov 检验仅在样本独立时使用。但是,在这里您可以找到一个以置换测试(在 R 中)形式完成工作的脚本。

Kolmogorov-Smirnov 检验是为两个独立样本设计的。您需要对成对观察进行测试。我认为没有人曾提出过用于配对观察的 KS 测试模拟。而且,这是一个非常谨慎的测试,即在很多情况下它的功率都很低。

我建议进行配对非参数检验,无论是符号检验还是 Wilcoxon 符号秩检验,都基于每个科目的两个分数之间的差异。后者更常见,并且对于具有正态分布和广泛非正态分布的观察具有强大的功效。

如果这两个度量是强相关的,那么符号检验可能会非常强大,可能比 Wilcoxon 符号秩检验更强大。两种检验都基于观察的排列:Wilcoxon 符号秩检验的符号差异和符号检验的差异符号。

弗里德曼检验通常用于三个或更多测量。如果只有两个测量值,它会给出与 Wilcoxon 检验相同的 p 值结果。

我相信你需要的是一个(Related-Samples) Friedman's Two-way Analysis of Variance by Ranks(见这个)。它带有一对关于您正在比较的分布的零假设,您可以根据 p 值拒绝/保留:

  • H0(a):“这k个条件所代表的总体得分分布相同。”
  • H0(b):“人口在条件所代表的不同度量上具有相同的分数分布。”

或者如 (2) 中所述:“对于 Friedman 的按等级进行的双向方差分析,原假设表明 K 个重复测量或匹配组来自同一人群或来自具有相同中位数 (1) 的人群。在零假设,检验假设响应变量具有相同的潜在连续分布; "

与 R 不太相关,但上述测试也是 IBM 在 (v24) SPSS 统计包中提供的,用于测试是否从同一人群中抽取了 k 个相关样本(请参阅IBM SPSS v24 文档):

  • "比较分布。弗里德曼的 2-way ANOVA 按等级(k 个样本)生成一个相关样本测试,以确定 k 个相关样本是否来自同一总体。您可以选择请求对 k 个样本进行多重比较,或者所有成对多重比较或逐步降压比较。”

参考

  • (1) 西格尔,S. (1956)。行为科学的非参数统计。
  • (2) Pereira, DG, Afonso, A., & Medeiros, FM (2015)。弗里德曼检验和事后分析概述。统计模拟和计算中的通信,44(10),2636-2653。