假设我有 100 个学生,每个学生有 2 个分数:阅读分数和写作分数,所以基本上我会有 2 个向量,每个向量的长度都是 100。
我想测试阅读分数和写作分数的分布是否相同,所以我想使用 Kolmogorov-Smirnov 测试,但是可以使用依赖数据运行测试吗?
假设我有 100 个学生,每个学生有 2 个分数:阅读分数和写作分数,所以基本上我会有 2 个向量,每个向量的长度都是 100。
我想测试阅读分数和写作分数的分布是否相同,所以我想使用 Kolmogorov-Smirnov 测试,但是可以使用依赖数据运行测试吗?
Kolmogorov-Smirnov 检验仅在样本独立时使用。但是,在这里您可以找到一个以置换测试(在 R 中)形式完成工作的脚本。
Kolmogorov-Smirnov 检验是为两个独立样本设计的。您需要对成对观察进行测试。我认为没有人曾提出过用于配对观察的 KS 测试模拟。而且,这是一个非常谨慎的测试,即在很多情况下它的功率都很低。
我建议进行配对非参数检验,无论是符号检验还是 Wilcoxon 符号秩检验,都基于每个科目的两个分数之间的差异。后者更常见,并且对于具有正态分布和广泛非正态分布的观察具有强大的功效。
如果这两个度量是强相关的,那么符号检验可能会非常强大,可能比 Wilcoxon 符号秩检验更强大。两种检验都基于观察的排列:Wilcoxon 符号秩检验的符号差异和符号检验的差异符号。
弗里德曼检验通常用于三个或更多测量。如果只有两个测量值,它会给出与 Wilcoxon 检验相同的 p 值结果。
我相信你需要的是一个(Related-Samples) Friedman's Two-way Analysis of Variance by Ranks(见这个)。它带有一对关于您正在比较的分布的零假设,您可以根据 p 值拒绝/保留:
或者如 (2) 中所述:“对于 Friedman 的按等级进行的双向方差分析,原假设表明 K 个重复测量或匹配组来自同一人群或来自具有相同中位数 (1) 的人群。在零假设,检验假设响应变量具有相同的潜在连续分布; "
与 R 不太相关,但上述测试也是 IBM 在 (v24) SPSS 统计包中提供的,用于测试是否从同一人群中抽取了 k 个相关样本(请参阅IBM SPSS v24 文档):
参考