单边 Kolmogorov-Smirnov 检验中的原假设是什么?

机器算法验证 假设检验 p 值 kolmogorov-smirnov 测试
2022-03-27 08:44:37

假设我使用 KS 来确定的 CDF是否大于的 CDF 。我得到统计数据其中C_xX的 ECDF ,同样适用于C_yXYD+=maxu{Cx(u)Cy(u)}CxXCy

有各种表格可以将其转换为 p 值。直观地说,如果我正在测试Cx<Cy似乎零假设应该是CxCy(如果是Cx=Cy那么我不明白它与双面测试有何不同。)

然而,对于我的数据集,我发现Cx<CyCx>Cy命题的 p 值都很低,这让我相信原假设不是替代假设的补充。

我完全误解了什么吗?

1个回答

我认为大多数为 KS 统计量提供 p 值的表格都是基于双边检验的。表中的值假设的原假设是两个样本来自相同的分布(即Cx=Cy)。所以实际上该表只关心CxCy之间差异的绝对值,而不是符号。这就是为什么您的结果显示Cx<<CyCx>>Cy两者都被认为是反对零假设的有力证据,具有较小的 p 值。

假设您的零假设是并且您想要的临界水平是您可以通过找到对应于的临界值并改用它来调整表中的值。这是有效的,因为该表将概率密度分成两个尾部,因此通过将指定的总尾部密度加倍,您正在“欺骗”它将分配到上尾部,这是您在一侧想要的测试。CxCyαD+2αα