泊松分布的拟合优度

机器算法验证 可能性 泊松分布 拟合优度
2022-03-02 12:11:11

有哪些众所周知的统计检验来衡量观察到的随机变量与泊松分布的拟合优度?我知道 Kolmogorov-Smirnov 测试就是其中之一,还有其他测试吗?

2个回答

1) Kolmogorov-Smirnov* 存在两个问题 -

a) 它假设分布是完全指定的,没有估计参数。如果您估计参数,则 KS 成为 Lilliefors 检验的一种形式(在这种情况下为泊松),并且您需要不同的临界值

b) 它假设分布是连续的

两者都会影响 p 值的计算,并且都降低了拒绝的可能性。

*(以及 Cramer-von Mises 和 Anderson Darling,以及任何其他假设连续的、完全指定的空值的测试)

除非您不介意潜在的高度保守的测试(大小未知),否则您必须调整这两者的显着性计算;需要模拟。

2)另一方面,在测试有序的东西时,香草卡方拟合优度是一个糟糕的主意,就像泊松一样。通过忽略排序,它实际上对更有趣的替代方案不是很敏感——它放弃了对抗直接有趣的替代方案(如过度分散)的能力,而是将其能力用于对抗“偶数超过奇数”之类的事情。因此,它对抗有趣替代方案的能力通常甚至低于香草 KS,但没有补偿低得多的 I 类错误率。

我认为这更糟。

3)在抓握的手上,您可以通过使用正交多项式将卡方划分为确实尊重排序的组件,并丢弃不太有趣的最高阶组件。在这种特殊情况下,您将使用与 Poisson pf 正交的多项式

这是 Rayner 和 Best 1989 年关于拟合优度的平滑测试的小书中采用的一种方法(他们有一个关于 R 中平滑测试的更新方法,可能会让你的生活更轻松)

或者,请参阅这样的论文:

http://www.jstor.org/discover/10.2307/1403470

4)但是,根据您这样做的原因,重新考虑整个企业可能会更好......

像这样的问题中的讨论会延续到大多数拟合优度测试......实际上通常通常会延续到大多数假设测试:

正态性测试“基本上没用”吗?

我使用什么测试来确认残差是正态分布的?

KS-Test 和其他测试(例如 Anderson Darling)用于连续分布。对于离散分布,您可以使用卡方拟合优度检验,该检验基于将 #observed 事件与基于分布的预期数量的预期数量进行比较。如果参数对于泊松分布已知,您显然会使用它,您更有可能使用 MLE 估计参数,这会降低卡方检验中的自由度。这里有一个例子;您只需使其适应您的特定分布: http: //www.stat.yale.edu/Courses/1997-98/101/chigf.htm