Kolmogorov-Smirnov 和格子路径

机器算法验证 kolmogorov-smirnov 测试
2022-03-31 09:34:39

我已经看到断言计算 Kolmogorov 的零分布的问题Dn+有限样本大小的统计量映射到计算保持在对角线下方的格路径数量的问题,因此可以通过投票定理来解决。我熟悉格路径和选票问题。我也熟悉分布的表达方式Dn+作为一系列积分。但我看不出一个问题如何映射到另一个问题。有人可以解释或指向我的文章或书吗?

我还看到声称 Kolmogorov-Smirnov 的零分布Dn=max(Dn+,Dn)映射到另一个可以通过“双边投票定理”解决的格路径问题。我不知道选票问题的“双面”版本会是什么。再次,有人可以解释或指出我的解释吗?

最后,是否有围绕所有这些的通用框架?Kuiper 统计量可以映射到另一个格路径问题吗?两样本KS测试?广告统计?

1个回答

为了在评论中添加@Cardinal 的答案,我认为有一些工作可以解决“声称 Kolmogorov-Smirnov 的零分布映射到另一个可以通过“双边投票定理”解决的格子路径问题和“是否有围绕所有这些的一般框架?两样本KS测试?”:

本文预印本)涉及r 样本 Kolmogorov-Smirnov检验,它们通过使用经典反射原理的推广计算晶格路径来推导精确的零分布。在第 2 节中,我发现他们很好地阐述了在推导零假设时格路径计数如何发挥作用。

在引言中,本文还通过回顾Kiefer 1959David 1958开始的想法,讨论了晶格路径计数和反射原理如何联系在一起。他们还简要讨论了如何将其视为 r-ballot 计票问题,参考Filaseta 1985

它们为任意数量的样本的 KS 类型测试提供格路径计数框架。从论文中:

我们考虑检验样本是否来自相同的连续分布的问题。作为检验统计量,我们将使用循环差异 其中表示这些样本的经验分布函数。维空间中的晶格路径的零分布 ,即,步长由单位向量给出r2F(x)δr(n)=max[δ1,2>(n),δ2,3(n),...,δr1,r(n),δr,1(n)],δij(n)=supx[Fn,i(x)Fn,j(x)]Fn,i(x),i=1,2,...,rδr(n)rei,i=1,2,...,r . 通过一个简单的变换,我们证明对于某个正整数,事件可能发生的方式数量就是路径的数量,其属性为路径上的那里有不等式链事实上,这些路径的枚举是组合学中一个经过充分研究的问题。反射原理再次发挥作用,因为我们必须计算仿射(因此是无限)外尔群的壁龛中的路径;有关该主题的技术背景的参考资料,请参阅Gessel 和 Zeilberger 1992k{nδr(n)<k}XXmx1,m>x2,m>...>>xr,m>x1,mrkGrabiner 2002Krattenthaler 2007

希望这是进一步调查 Kuiper 和 AD 统计数据的良好起点。