如何检验数据样本是否符合 Gamma 分布族?

机器算法验证 分布 假设检验 拟合优度 伽马分布
2022-01-24 12:27:25

我有一个从连续随机变量 X 生成的数据样本。从我使用 R 绘制的直方图来看,我猜 X 的分布可能服从某个 Gamma 分布。但我不知道这个 Gamma 分布的确切参数。

我的问题是如何测试 X 的分布是否属于 Gamma 分布家族?存在一些拟合优度检验,如 Kolmogorov-Smirnov 检验、Anderson-Darling 检验等,但使用这些检验时的限制之一是必须事先知道理论分布的参数。有人能告诉我如何解决这个问题吗?

2个回答

我认为这个问题要求进行精确的统计测试,而不是直方图比较。当使用带有估计参数的 Kolmogorov-Smirnov 检验时,零下的检验统计量分布取决于测试分布,而不是没有估计参数的情况。例如,使用(在 R 中)

x <- rnorm(100)
ks.test(x, "pnorm", mean=mean(x), sd=sd(x))

导致

        One-sample Kolmogorov-Smirnov test

data:  x 
D = 0.0701, p-value = 0.7096
alternative hypothesis: two-sided

当我们得到

> ks.test(x, "pnorm")

        One-sample Kolmogorov-Smirnov test

data:  x 
D = 0.1294, p-value = 0.07022
alternative hypothesis: two-sided 

对于相同的样本 x。因此,显着性水平或 p 值必须在零值下通过蒙特卡罗模拟来确定,从估计分布下模拟的样本产生 Kolmogorov-Smirnov 统计量的分布(考虑到观察到的样本,结果略有近似)来自另一个分布,即使在 null 下)。

假设数据的伽马分布计算参数的 MLE,并将理论密度与数据的直方图进行比较。如果两者非常不同,则伽马分布对您的数据的近似值很差。例如,对于正式检验,您可以计算 Kolmogorov-Smirnoff 检验统计量,比较最佳拟合 gamma 分布与经验分布并检验显着性。