您是否有任何特殊原因会选择核密度估计而不是参数估计?我正在学习如何将分布拟合到我的数据中。这个问题来找我。
我的数据量相对较大,有 7500 个数据点。汽车索赔。我的目标是使其适合分布(非参数或参数)。然后用它来模拟汽车索赔数据,计算VaR或TVaR。
我用log对数据进行转换,使其相对正常。我拟合了许多分布,包括正态、对数正态、伽马、t 等......我使用 AIC 和对数似然来确定最佳拟合。但是所有这些拟合都没有通过 KS 测试(p 值极小,具有 e-10)。
这就是为什么我问在什么情况下我应该切换到 KDE。