假设我使用 KS 来确定的 CDF是否大于的 CDF 。我得到统计数据其中C_x是X的 ECDF ,同样适用于C_y。
有各种表格可以将其转换为 p 值。直观地说,如果我正在测试似乎零假设应该是。(如果是那么我不明白它与双面测试有何不同。)
然而,对于我的数据集,我发现和命题的 p 值都很低,这让我相信原假设不是替代假设的补充。
我完全误解了什么吗?
假设我使用 KS 来确定的 CDF是否大于的 CDF 。我得到统计数据其中C_x是X的 ECDF ,同样适用于C_y。
有各种表格可以将其转换为 p 值。直观地说,如果我正在测试似乎零假设应该是。(如果是那么我不明白它与双面测试有何不同。)
然而,对于我的数据集,我发现和命题的 p 值都很低,这让我相信原假设不是替代假设的补充。
我完全误解了什么吗?
我认为大多数为 KS 统计量提供 p 值的表格都是基于双边检验的。表中的值假设的原假设是两个样本来自相同的分布(即)。所以实际上该表只关心和之间差异的绝对值,而不是符号。这就是为什么您的结果显示或。两者都被认为是反对零假设的有力证据,具有较小的 p 值。
假设您的零假设是并且您想要的临界水平是。您可以通过找到对应于的临界值并改用它来调整表中的值。这是有效的,因为该表将概率密度分成两个尾部,因此通过将指定的总尾部密度加倍,您正在“欺骗”它将分配到上尾部,这是您在一侧想要的测试。