机器算法验证 - 对数正态分布的保险索赔总和 - 吾爱随笔录

对于计算保险中预期索赔的方法，我必须假设对数正态分布。对于测试，我将使用年度累积数据。以 20 年为上限的小样本，我的想法是使用分类数据 - 每月或个人索赔。现在我发现对数正态声明的总和不是对数正态分布的。有什么想法可以提高测试的威力吗？

编辑：总体目标是通过最大似然估计来计算索赔的波动性。分布检验是 Kolmogorov-Smirnov。问题是我的年度数据只有 5 年的数据，而 20 年后的上限。

在使用来自对数正态分布、正态分布和伽马分布的随机样本进行预测试时，如果数据确实是对数正态分布，即使有 5 年的数据，我也会得到很好的结果，但测试只会下降 5 年数据的伽马分布样本的 5% 左右（在 10,000 个样本中）。

H0 下降的概率 = 样本呈对数分布

这里是模拟代码，如果我的设置方式有问题，我将不胜感激。

n = 5:20
Loops = 10000
GammaRes = LogNormRes = NormRes = matrix(rep(NA, length(n)*Loops),nrow = Loops)
for(j in 1:Loops)
{
   count = 0
   for(i in n)
   {
      count = count + 1
      GammaVerluste = rgamma(i, shape =2 )
      LogNormVerluste = rlnorm(i)
      NormVerluste = rnorm(i)
      GammaRes[j,count] = ks.test(GammaVerluste, "plnorm")$p.value
      LogNormRes[j,count] = ks.test(LogNormVerluste, "plnorm")$p.value
      NormRes[j,count] = ks.test(NormVerluste, "plnorm")$p.value
   } 
}
Alpha = 0.01

DeclineGamma = DeclineNormal = DeclineLogNormal = rep(NA, length(n))
count = 0
for(i in 1:length(n))
{
   DeclineGamma[i] = sum(GammaRes[,i] < Alpha)/Loops
   DeclineNormal[i] = sum(NormRes[,i] < Alpha)/Loops
   DeclineLogNormal[i] = sum(LogNormRes[,i] < Alpha)/Loops
}