我可以使用 Kolmogorov-Smirnov 来比较两个经验分布吗?

机器算法验证 假设检验 分布 kolmogorov-smirnov 测试
2022-02-16 02:54:27

是否可以使用 Kolmogorov-Smirnov 拟合优度检验来比较两个经验分布以确定它们是否似乎来自相同的基础分布,而不是将一个经验分布与预先指定的参考分布进行比较?

让我试着用另一种方式问这个问题。我从一个位置的某个分布中收集 N 个样本。我在另一个地方收集了 M 个样本。数据是连续的(例如,每个样本都是 0 到 10 之间的实数)但不是正态分布的。我想测试这些 N+M 样本是否都来自相同的底层分布。为此目的使用 Kolmogorov-Smirnov 检验是否合理?

特别是,我可以个样本中 ,从之间的距离:即,计算,并使用D作为我的检验统计量,如 Kolmogorov-Smirnov 检验中的拟合优度。这是一个合理的方法吗?F0NF1MF0F1D=supx|F0(x)F1(x)|D

(我在其他地方读到 Kolmogorov-Smirnov 拟合优度检验对离散分布无效,但我承认我不明白这意味着什么或为什么它可能是正确的。这是否意味着我提出的方法是不好的? )

或者,你推荐别的东西吗?

1个回答

这没关系,也很合理。它被称为两样本 Kolmogorov-Smirnov 检验通过 supnorm 测量两个分布函数之间的差异始终是明智的,但是要进行正式测试,您想知道假设两个样本是独立的并且每个 iid 来自相同的基础分布的分布。要依赖通常的渐近理论,您将需要基础公共分布的连续性(而不是经验分布的连续性)。有关更多详细信息,请参阅上面链接的 Wikipedia 页面。

在 R 中,您可以使用,它为小样本量 ks.test计算精确的p