如何使用前 k 个(经验)矩拟合近似 PDF(即:密度估计)?

机器算法验证 密度函数 内核平滑 时刻
2022-03-04 05:26:51

我有一种情况,我可以估计(第一个)k数据集的矩,并想用它来产生密度函数的估计。

我已经遇到过Pearson 分布,但意识到它仅依赖于前 4 个时刻(对可能的时刻组合有一些限制)。

我也明白,当不使用更多假设时,任何有限的矩集都不足以“确定”特定的分布。但是,我仍然想要更通用的分布类别(除了 Pearson 分布系列)。查看其他问题,我找不到这样的分布(请参阅:herehereherehereherehere)。

是否有一些(“简单”)广义分布族可以为任何一组定义k时刻?(也许是一组可以采用标准正态分布的变换并对其进行变换,直到它与所有一组k时刻)

(我不在乎我们是否假设另一个k+1时刻是否为0)

谢谢。

ps:我会很高兴有一个扩展的例子。最好带有 R 代码示例。

1个回答

方法一:高阶皮尔逊系统

按照惯例,Pearson 系统被视为解决方案系列p(x)到微分方程:

dp(x)dx=(a+x)c0+c1x+c2x2p(x)

其中四个 Pearson 参数(a,c0,c1,c2)可以用总体的前四个矩来表示。

而不是将皮尔逊系统基于二次c0+c1x+c2x2,可以考虑使用高阶多项式作为基石。因此,例如,可以考虑基于三次多项式的 Pearson 式系统。这将是解决方案系列p(x)到微分方程:

dp(x)dx=(a+x)c0+c1x+c2x2+c3x3p(x)

这产生了解决方案:

在此处输入图像描述

前段时间我为了好玩而解决了这个问题(与 OP 有相同的思路):推导和解决方案在我们书的第 5 章中给出;如果有兴趣,可以在这里免费下载:

http://www.mathstatica.com/book/bookcontents.html

请注意,虽然二阶(二次)Pearson 族可以用前 4 个矩表示,但三阶(三次)Pearson 式族需要前 6 个矩。

方法 2:Gram-Charlier 展开式

Gram-Charlier 展开式也在同一章第 5 章(参见第 5.4 节)中进行了讨论......并且还允许构建一个拟合密度,基于任意大kth时刻。正如 OP 所建议的那样,Gram-Charlier 展开将拟合的 pdf 表示为标准正态 pdf 的一系列导数的函数,称为 Hermite 多项式。Gram-Charlier 系数被求解为种群矩的函数......并且扩展越大,所需的矩越多。您可能还希望查看相关的御剑扩展。

人口时刻或样本时刻?

对于 Pearson 式系统:如果总体的矩是已知的,那么使用更高的矩应该明确地产生更好的拟合。然而,如果观察到的数据是从总体中抽取的随机样本,则需要权衡:高阶多项式意味着需要高阶矩,而后者的估计可能不可靠(具有高方差),除非样本量“大”。换句话说,给定样本数据,使用更高的矩进行拟合可能会变得“不稳定”并产生较差的结果。Gram-Charlier 展开式也是如此:添加一个额外的项实际上会产生更差的拟合,因此需要注意。