Python scipy 中的 ks_2samp 测试 - 低 D 统计量,低 p 值?

机器算法验证 统计学意义 Python p 值 kolmogorov-smirnov 测试 scipy
2022-03-12 17:44:15

正如标题所说,我在ks_2samp测试中得到的 D 统计量和 p 值都很低。更具体地说:

Ks_2sampResult(statistic=0.049890046265079313, pvalue=0.0011365796735152277)

我认为这两个结果似乎有点矛盾。如果两个 CDF 之间的绝对差为 0.05,我会说它们几乎是相同的分布,看到如此低的 p 值对我来说是非常不直观和奇怪的。

我的两个变量的样本量都超过 1500。它们的范围都是 [0,1]。现在,我找到了这篇文章

似乎 p 值和 D 统计量都随着样本大小的增加而减小。这让我担心使用这种方法来测试两个分布是否相同。我想听听更多关于这个的意见,因为我现在非常确信在我的情况下这不应该被信任。但是,如果它确实在这里具有误导性,那么无论如何我为什么要相信它呢?

0个回答
没有发现任何回复~