机器算法验证 - 如何检验数据样本是否符合 Gamma 分布族？ - 吾爱随笔录

机器算法验证分布假设检验拟合优度伽马分布

2022-01-24 12:27:25

我有一个从连续随机变量 X 生成的数据样本。从我使用 R 绘制的直方图来看，我猜 X 的分布可能服从某个 Gamma 分布。但我不知道这个 Gamma 分布的确切参数。

我的问题是如何测试 X 的分布是否属于 Gamma 分布家族？存在一些拟合优度检验，如 Kolmogorov-Smirnov 检验、Anderson-Darling 检验等，但使用这些检验时的限制之一是必须事先知道理论分布的参数。有人能告诉我如何解决这个问题吗？

2个回答

我认为这个问题要求进行精确的统计测试，而不是直方图比较。当使用带有估计参数的 Kolmogorov-Smirnov 检验时，零下的检验统计量分布取决于测试分布，而不是没有估计参数的情况。例如，使用（在 R 中）

x <- rnorm(100)
ks.test(x, "pnorm", mean=mean(x), sd=sd(x))

导致

        One-sample Kolmogorov-Smirnov test

data:  x 
D = 0.0701, p-value = 0.7096
alternative hypothesis: two-sided

当我们得到

> ks.test(x, "pnorm")

        One-sample Kolmogorov-Smirnov test

data:  x 
D = 0.1294, p-value = 0.07022
alternative hypothesis: two-sided

对于相同的样本 x。因此，显着性水平或 p 值必须在零值下通过蒙特卡罗模拟来确定，从估计分布下模拟的样本产生 Kolmogorov-Smirnov 统计量的分布（考虑到观察到的样本，结果略有近似）来自另一个分布，即使在 null 下）。

假设数据的伽马分布计算参数的 MLE，并将理论密度与数据的直方图进行比较。如果两者非常不同，则伽马分布对您的数据的近似值很差。例如，对于正式检验，您可以计算 Kolmogorov-Smirnoff 检验统计量，比较最佳拟合 gamma 分布与经验分布并检验显着性。

其它你可能感兴趣的问题