假设我们有一个数据样本和由某个参数向量 \theta 索引的一系列分布。我们想将拟合到以获得到的拟合优度 .
有没有通用的方法来做到这一点?也许对于某些发行系列?对于估计的具体方法?
问题当然是我们首先要使用我们想要评估拟合分布的数据。在是由均值和方差参数化的正态分布族的特定情况下,我们可以使用Lilliefors 检验。有什么适用于其他分销系列的东西吗?
我最初认为概率积分变换 (PIT)可能有效,但快速模拟表明它不起作用 - p 值直方图在中间看起来足够均匀,但它们对于和:
n_sims <- 1e4
nn <- 20
pp_pit_specified <- pp_pit_estimated <- matrix(NA,nrow=n_sims,ncol=20)
pb <- winProgressBar(max=n_sims)
for ( ii in 1:n_sims ) {
setWinProgressBar(pb,ii,paste(ii,"of",n_sims))
set.seed(ii)
sim <- rnorm(nn)
pp_pit_specified[ii,] <- pnorm(sim,mean=0,sd=1)
pp_pit_estimated[ii,] <- pnorm(sim,mean=mean(sim),sd=sd(sim))
}
close(pb)
opar <- par(mfrow=c(1,2))
hist(pp_pit_specified,main="Parameters specified",xlab="",col="lightgray")
hist(pp_pit_estimated,main="Parameters estimated",xlab="",col="lightgray")
par(opar)
这是由p 值的非均匀分布引起的。不,我没有具体的用例,我只是好奇。
