我有一个从连续随机变量 X 生成的数据样本。从我使用 R 绘制的直方图来看,我猜 X 的分布可能服从某个 Gamma 分布。但我不知道这个 Gamma 分布的确切参数。
我的问题是如何测试 X 的分布是否属于 Gamma 分布家族?存在一些拟合优度检验,如 Kolmogorov-Smirnov 检验、Anderson-Darling 检验等,但使用这些检验时的限制之一是必须事先知道理论分布的参数。有人能告诉我如何解决这个问题吗?
我有一个从连续随机变量 X 生成的数据样本。从我使用 R 绘制的直方图来看,我猜 X 的分布可能服从某个 Gamma 分布。但我不知道这个 Gamma 分布的确切参数。
我的问题是如何测试 X 的分布是否属于 Gamma 分布家族?存在一些拟合优度检验,如 Kolmogorov-Smirnov 检验、Anderson-Darling 检验等,但使用这些检验时的限制之一是必须事先知道理论分布的参数。有人能告诉我如何解决这个问题吗?
我认为这个问题要求进行精确的统计测试,而不是直方图比较。当使用带有估计参数的 Kolmogorov-Smirnov 检验时,零下的检验统计量分布取决于测试分布,而不是没有估计参数的情况。例如,使用(在 R 中)
x <- rnorm(100)
ks.test(x, "pnorm", mean=mean(x), sd=sd(x))
导致
One-sample Kolmogorov-Smirnov test
data: x
D = 0.0701, p-value = 0.7096
alternative hypothesis: two-sided
当我们得到
> ks.test(x, "pnorm")
One-sample Kolmogorov-Smirnov test
data: x
D = 0.1294, p-value = 0.07022
alternative hypothesis: two-sided
对于相同的样本 x。因此,显着性水平或 p 值必须在零值下通过蒙特卡罗模拟来确定,从估计分布下模拟的样本产生 Kolmogorov-Smirnov 统计量的分布(考虑到观察到的样本,结果略有近似)来自另一个分布,即使在 null 下)。
假设数据的伽马分布计算参数的 MLE,并将理论密度与数据的直方图进行比较。如果两者非常不同,则伽马分布对您的数据的近似值很差。例如,对于正式检验,您可以计算 Kolmogorov-Smirnoff 检验统计量,比较最佳拟合 gamma 分布与经验分布并检验显着性。