相信哪个:Kolmogorov-Smirnov 检验或 QQ 情节?

机器算法验证 密度函数 kolmogorov-smirnov 测试 累积分布函数 QQ图
2022-01-30 19:28:47

我正在尝试确定我的连续数据数据集是否遵循具有参数形状的伽马分布=1.7和率=0.000063。

问题是当我使用 R 创建数据集的 QQ 图时x针对理论分布 gamma (1.7, 0.000063),我得到的图表明经验数据与 gamma 分布大致一致。ECDF 图也会发生同样的事情。

但是,当我运行 Kolmogorov-Smirnov 测试时,它给了我一个不合理的小p-的价值<1%.

我应该选择相信哪个?图形输出还是 KS-test 的结果?

QQ图和ECDF图

4个回答

我认为不“相信”QQ情节(如果你制作得当的话)没有任何意义;它只是数据现实的图形表示,与定义分布并列。显然这不是一个完美的匹配,但如果它足以满足您的目的,那可能或多或少是故事的结局。您可能想查看这个相关问题:正态性测试“基本上没用”吗?

p来自 KS 测试的 -value 基本上告诉您,您的样本量足够大,足以证明您的数据属于与您的参考分布完全相同的分布的原假设(我假设您参考了 gamma 分布;您可能想要仔细检查你做了)。从 QQ 图中也可以看出这一点(即,存在一些小的但看似系统的偏差模式),所以我认为这里没有任何相互矛盾的信息。

对于您的预期目的,您的数据是否与伽马分布差异太大是另一个问题。单独的 KS 测试无法为您解答(因为它的结果将取决于您的样本量以及其他原因),但 QQ 图可能会帮助您做出决定。您可能还想研究您计划运行的任何其他分析的可靠替代方案,如果您特别认真地注意任何后续分析对伽马分布偏差的敏感性,您可能还需要考虑进行一些模拟测试.

你可以做的是从你的理论分布中创建多个样本,并将它们绘制在你的 QQ 图的背景上。这将使您了解仅从抽样中可以合理地期望什么样的可变性。

您可以使用以下第 86-89 页中的示例扩展该想法以围绕理论线创建一个信封:

Venables, WN 和 Ripley, BD 2002。S. New York 的现代应用统计:Springer。

这将是一个逐点信封。您可以使用以下第 151-154 页中的想法进一步扩展该想法以创建整体信封:

Davison, AC 和 Hinkley, DV 1997。引导方法及其应用。剑桥:剑桥大学出版社。

但是,对于基本探索,我认为仅在 QQ 图的背景中绘制几个参考样本就足够了。

KS 测试假定您的分布具有特定参数。它测试了“数据根据这个特定的分布分布”的假设。您可能在某处指定了这些参数。如果不是,则可能使用了一些不匹配的默认值。请注意,如果将估计的参数插入假设,则 KS 检验将变得保守。

但是,大多数拟合优度测试都以错误的方式使用。如果 KS 检验没有显示显着性,这并不意味着您要证明的模型是合适的。这就是@Nick Stauner 所说的样本量太小。这个问题类似于点假设检验和等价检验。

所以最后:只考虑QQ图。

QQ 图是一种探索性数据分析技术,应该这样对待 - 所有其他 EDA 图也是如此。它们只是为了让您初步了解手头的数据。您永远不应该根据 QQ 图这样的 EDA 图来决定或停止您的分析。只考虑 QQ 图是错误的建议。您绝对应该使用 KS Test 等定量技术。假设你有另一个相似数据集的 QQ 图,如果没有量化工具,你会如何比较两者?在 EDA 和 KS 测试之后,下一步对您来说是找出 KS 测试给出低 p 值的原因(在您的情况下,它甚至可能是由于某些错误)。

EDA 技术并非旨在用作决策工具。事实上,我想说即使是推论统计也只是探索性的。它们为您提供有关您的统计分析应该向哪个方向进行的指示。例如,对样本的 t 检验只会为您提供样本可能(或可能不)属于总体的置信水平,您仍然可以根据该洞察进一步了解您的数据属于什么分布以及什么是它的参数等等。事实上,当某些状态甚至作为机器学习库的一部分实现的技术在本质上也是探索性的!我希望他们是在这个意义上说的......!

根据图表或可视化技术得出统计决策是对统计科学取得的进步的嘲弄。如果你问我,你应该使用这些图作为工具,根据你的定量统计分析来传达最终结论。