对于计算保险中预期索赔的方法,我必须假设对数正态分布。对于测试,我将使用年度累积数据。以 20 年为上限的小样本,我的想法是使用分类数据 - 每月或个人索赔。现在我发现对数正态声明的总和不是对数正态分布的。有什么想法可以提高测试的威力吗?
编辑:总体目标是通过最大似然估计来计算索赔的波动性。分布检验是 Kolmogorov-Smirnov。问题是我的年度数据只有 5 年的数据,而 20 年后的上限。
在使用来自对数正态分布、正态分布和伽马分布的随机样本进行预测试时,如果数据确实是对数正态分布,即使有 5 年的数据,我也会得到很好的结果,但测试只会下降 5 年数据的伽马分布样本的 5% 左右(在 10,000 个样本中)。

这里是模拟代码,如果我的设置方式有问题,我将不胜感激。
n = 5:20
Loops = 10000
GammaRes = LogNormRes = NormRes = matrix(rep(NA, length(n)*Loops),nrow = Loops)
for(j in 1:Loops)
{
count = 0
for(i in n)
{
count = count + 1
GammaVerluste = rgamma(i, shape =2 )
LogNormVerluste = rlnorm(i)
NormVerluste = rnorm(i)
GammaRes[j,count] = ks.test(GammaVerluste, "plnorm")$p.value
LogNormRes[j,count] = ks.test(LogNormVerluste, "plnorm")$p.value
NormRes[j,count] = ks.test(NormVerluste, "plnorm")$p.value
}
}
Alpha = 0.01
DeclineGamma = DeclineNormal = DeclineLogNormal = rep(NA, length(n))
count = 0
for(i in 1:length(n))
{
DeclineGamma[i] = sum(GammaRes[,i] < Alpha)/Loops
DeclineNormal[i] = sum(NormRes[,i] < Alpha)/Loops
DeclineLogNormal[i] = sum(LogNormRes[,i] < Alpha)/Loops
}