为什么 Kolmogorov-Smirnov 检验有效?

机器算法验证 分布 统计学意义 非参数 kolmogorov-smirnov 测试
2022-02-04 04:11:49

在阅读 2-sample KS 测试时,我完全理解它在做什么,但我不明白它为什么起作用

换句话说,我可以按照所有步骤计算经验分布函数,找到两者之间的最大差异以找到 D 统计量,计算临界值,将 D 统计量转换为 p 值等。

但是,我不知道为什么这实际上告诉了我有关这两个发行版的任何信息。

有人可以很容易地告诉我,我需要跳过一头驴并计算它跑的速度,如果速度小于 2 公里/小时,那么我拒绝零假设。当然我可以做你让我做的事,但是这些和零假设有什么关系呢?

为什么 2 样本 KS 测试有效?计算 ECDF 之间的最大差异与两个分布的差异有什么关系?

任何帮助表示赞赏。我不是统计学家,所以如果可能的话,假设我是个白痴。

3个回答

基本上,作为 Glivenko Cantelli 定理的直接结果,该测试是一致的,这是经验过程和统计数据的最重要结果之一。

GC 告诉我们 Kolmogorov Smirnov 检验统计量变为 0,因为n在原假设下。在您处理实际分析和极限定理之前,它可能看起来很直观。这是一个启示,因为该过程可以被认为是无数个随机过程,因此定律或概率会导致人们相信总有一个点可以超过任何 epsilon 边界,但不,上确界将收敛于从长远来看。

多久?我不知道。测试的威力有点令人怀疑。我永远不会在现实中使用它。

http://www.math.utah.edu/~davar/ps-pdf-files/Kolmogorov-Smirnov.pdf

我们有两个独立的单变量样本:

X1,X2,...,XNiidFY1,Y2,...,YMiidG,
在哪里GF是连续累积分布函数。Kolmogorov-Smirnov 测试正在测试
H0:F(x)=G(x)for all xRH1:F(x)G(x)for some xR.
如果原假设为真,那么{Xi}i=1N{Yj}j=1M是来自相同分布的样本。所需要的一切XiYj从不同的分布中抽取是为了FG至少相差任何数量x价值。所以KS测试是估计FG使用每个样本的经验 CDF,磨练两者之间最大的逐点差异,并询问该差异是否“足够大”以得出结论F(x)G(x)在某些时候xR.

一个直观的看法:

Kolmogorov-Smirnov 检验从根本上依赖于观察分布的顺序。逻辑是,如果两个基本分布相同,则取决于样本大小,两者之间的排序应该很好地打乱。

如果样本排序以足够极端的方式“未打乱”(例如,分布中的所有或大部分观察Y分布观察之前X,这将使D统计量大得多),这被视为基础分布不相同的零假设的证据。

如果两个样本分布被很好地打乱,那么D不会有机会变得非常大,因为的有序值XY将倾向于彼此跟踪,并且您将没有足够的证据来拒绝空值。