核密度估计矩

机器算法验证 估计 内核平滑 时刻
2022-03-21 02:18:05

假设我有一个随机样本X1,,Xm从一些分布F,我想估计前两个时刻F. 显然,任何理智的人都会使用示例时刻,但我想知道以下情况:

我没有使用样本矩,而是使用核密度估计,例如使用高斯核,这给我留下了一些分布,在这种情况下,由于高斯核,正态分布的混合。现在,我的问题是:在“KDE 分布”的均值和方差收敛到真实分布的条件下是否有任何结果F? 这如何取决于样本的内核、带宽或属性?

我无法像往常一样找到这方面的研究,诸如“KD 估计在某一点上的期望是什么?x?” 似乎得到了解决,而不是结果分布的时刻。

1个回答

通过总期望定律和总方差定律,矩是相当简单的

  1. 总期望定律

    E(Y)=E(E(YX)),

    这里X是原始变量并且Y|X可以认为是内核。无条件分布是生成的 KDE。

    我们有E(Y|X)=X, 所以E(Y)=E(X)=μF.

  2. 总方差定律

    Var(Y)=E[Var(Y|X)]+Var(E[Y|X]).

    Var(Y|X)是内核的方差X,它是常数,所以E(Var(Y|X))=σK2=h2.

    第二项减少为Var(X)=σF2

    所以Var(Y)=σF2+h2.

总之,期望不受零均值内核的影响,但方差(不出所料)会因内核的方差而增加。