拟合优度检验:关于 Anderson-Darling 检验和 Cramér-von Mises 标准的问题

机器算法验证 拟合优度 安德森宠儿测试
2022-03-18 00:43:58

当我来到Anderson-Darling 检验Cramér-von Mises 标准时,我正在阅读网页以进行拟合优度检验

到目前为止,我明白了这一点;似乎 Anderson-Darling 检验和 Cramér-von Mises 标准是相似的,只是基于不同的加权函数 w还有一个名为Watson 检验的 Cramér–von Mises 标准的变体。

基本上我这里有两个问题

  1. 关于这两种方法的谷歌搜索结果并不多;它们仍然是最先进的吗?或者已经被一些更好的方法取代了?

    这有点令人惊讶,根据这篇关于Shapiro-Wilk、Kolmogorov-Smirnov、Lilliefors 和 Anderson-Darling 检验的功率比较的论文,AD 的表现相当不错;总是比 Lilliefors 和 KS 好,并且非常接近专门为正态分布设计的 SW 检验。

  2. 此类检验的置信区间是多少?

    对于 AD、CM 和 Watson 测试,我看到了 wiki 页面上定义的测试统计变量,但没有找到置信区间。

    KS 测试的情况更简单:在wiki 页面上,置信区间由 Kα 定义,它由 K 的累积分布函数定义。

2个回答

不可能有单一的最先进的拟合优度(例如,不存在跨通用替代方案的 UMP 测试,实际上甚至没有什么能接近——即使是备受推崇的综合测试在某些情况下也具有可怕的能力)。

通常,在选择检验统计量时,您会选择最重要的偏差类型,以检测并使用擅长该工作的检验统计量。一些测试在各种有趣的替代方案上都做得很好,使它们成为不错的默认选择,但这并不能使它们成为“最先进的”。

Anderson Darling 仍然很受欢迎,而且有充分的理由。如今,Cramer-von Mises 测试的使用要少得多(令我惊讶的是,它通常比 Kolmogorov-Smirnov 更好,但比 Anderson-Darling 更简单——并且在“中间”的差异上通常比它具有更好的能力分布)

所有这些测试都存在对某些替代方案的偏见,并且很容易找到 Anderson-Darling 比其他测试做得更差(非常糟糕)的情况。(正如我所建议的,它更像是“课程的马”,而不是一个测试来统治它们)。不幸的是,通常很少考虑这个问题(什么是最好的选择对我来说最重要的偏差?)。

您可能会在其中一些帖子中找到一些价值:

夏皮罗-威尔克是最好的正态性检验吗?为什么它可能比 Anderson-Darling 等其他测试更好?

2 样本 Kolmogorov-Smirnov vs. Anderson-Darling vs Cramer-von-Mises(关于两个样本测试,但许多陈述延续

分布之间 Kolmogorov 距离的动机(更多的理论讨论,但有几个关于实际意义的要点)


我认为您无法在 Cramer-von Mises 和 Anderson Darline 统计中形成 cdf 的置信区间,因为标准基于所有偏差,而不仅仅是最大偏差。

Anderson-Darling 检验并非在所有分布上都可用,但具有良好的功效并接近于 Shapiro-Wilk 检验的功效,除了少量样本,因此两者在 $n=400$ Razali NM, Wah时等效YB。Shapiro-Wilk、Kolmogorov-Smirnov、Lilliefors 和 Anderson-Darling 检验的功率比较。统计建模与分析杂志。2011;2:21-33。但是,Shapiro-Wilk 检验仅用于正态分布检验。Cramér-von Mises 检验和 Pearson 卡方检验适用于直方图的所有分布拟合,我认为 Cramér-von Mises 检验比 Pearson 卡方检验更有效。Cramer -von Mises 检验n=400 是一种比 Kolmogorov-Smirnov 检验更强大的累积密度函数拟合优度检验,其功效可以大于或小于 t 检验。卡方难以处理低细胞数,因此使用范围限制来拟合尾部。

**问题 1:......这两种方法......仍然是最先进的吗?或者已经被一些更好的方法取代了?问题 2 此类检验的置信区间是多少?**

答:它们是最先进的。但是,有时我们需要置信区间而不是概率。在将这些方法相互比较时,我们说的是功效而不是置信区间。有时使用 AIC、BIC 和其他标准分析拟合优度,与良好拟合的概率形成对比,有时拟合优度标准是不相关的,例如,当拟合优度不是拟合标准时. 在后一种情况下,我们的回归目标可能是与拟合无关的物理量,例如,参见Tk-GV