在阅读 2-sample KS 测试时,我完全理解它在做什么,但我不明白它为什么起作用。
换句话说,我可以按照所有步骤计算经验分布函数,找到两者之间的最大差异以找到 D 统计量,计算临界值,将 D 统计量转换为 p 值等。
但是,我不知道为什么这实际上告诉了我有关这两个发行版的任何信息。
有人可以很容易地告诉我,我需要跳过一头驴并计算它跑的速度,如果速度小于 2 公里/小时,那么我拒绝零假设。当然我可以做你让我做的事,但是这些和零假设有什么关系呢?
为什么 2 样本 KS 测试有效?计算 ECDF 之间的最大差异与两个分布的差异有什么关系?
任何帮助表示赞赏。我不是统计学家,所以如果可能的话,假设我是个白痴。