您可以使用 Kolmogorov-Smirnov 检验直接检验两个分布的等价性吗?

机器算法验证 分布 kolmogorov-smirnov 测试 等价 托斯特
2022-03-28 11:59:19

关于如何使用两个单面检验 (TOST) 方法进行 Kolmogorov-Smirnov (KS) 检验的其他问题一直在讨论,但我想知道是否可以直接使用检验统计量来显示两个分布相似?

据我了解,KS 检验统计量代表了两个 CDF 之间的最大差异,单样本版本最初用作拟合优度检验。这在 [1] 中显示为当经验分布超出置信区间时(即任何一点与他们正在测试的假设分布太远)。

如果双样本版本经常用于表明两个分布之间存在显着差异,则与单样本版本类似,我们是否可以将置信区间的计算从使用(1α)=0.05改为使用(1α)=0.95,作为表明两个分布之间的最大差异显着相似的一种方式?

[1] Massey, F. “Kolmogorov-Smirnov 拟合优度检验”,美国统计协会杂志,第一卷。46,没有。253,第 68-78 页,1951 年 3 月

1个回答

在进行 Kolmogorov-Smirnov 检验时,我们假设H0:这两种分布是等价的。然后我们计算一个检验统计量,如果对应的p-值足够小,我们拒绝H0并得出结论HA:两种分布不同。

就假设检验而言,我们使用p-value 来量化我们必须拒绝零假设的证据量。一个p- 值为 1 表示我们没有收集到拒绝原假设的证据。一个p- 接近 0 的值表示有压倒性的证据拒绝原假设。

假设我们有数据并计算p- 来自 KS 测试的值p=0.99. 这表明几乎没有证据可以拒绝零假设。但是,我们无法建立一个标准α=0.95这样p>α意味着我们得出的结论是原假设是正确的。 此外,我不相信有一个替代测试可以让我们得出结论,这两个分布是相同的。

我相信你能做的就是在写作或讨论中完全诚实。提及您进行了 KS 测试,报告一个p-值,如果p- 值足够高,然后阐明几乎没有证据表明这两种分布不同。因此,虽然您无法得出分布相同的结论,但您应该能够注意到没有证据表明这两个分布不同。作为您的样本量n增加,你对这个答案的信心就越大。

这不是您可能正在寻找的答案,但也不是完全清洗。希望这可以帮助!