Silverman (1981) 所说的“临界带宽”是什么意思?

机器算法验证 计量经济学 内核平滑
2022-03-29 10:57:48

在为核密度估计器选择带宽时,根据我的理解,关键带宽是:

“对于每个整数 k,其中1<k<n,我们可以找到最小宽度h(k),使得核密度估计最多具有 k 个最大值。Silverman 将这些h(k)值称为“临界宽度”。

我不直观地理解这个概念。任何帮助,将不胜感激。

谢谢!

2个回答

如果你有一个非常宽的带宽,你会在你的 KDE 中获得一个峰值。如果你减少一点,它仍然是一个峰值。继续减少它,直到达到添加第二个峰值的切换点。该带宽是h(1).

现在让它更小,直到你在两个峰值和三个峰值之间切换。那是h(2).

等等。

为第 2、第 3 和第 4 个峰值添加每个新峰值(即在临界带宽)之前和之后显示较小带宽的一系列 KDE

在之间的任何带宽h(i1)h(i)你将会有iKDE 中的峰值。

西尔弗曼想要为那一套命名h-价值观;他称它们为临界带宽

例如,这出现在他的多模态测试中。

我讨厌网页中的动画,但是这个问题需要一个动画的答案:

数字

这些是一组三个值(接近 -2.5、0.5 和 2.5)的 KDE。它们的带宽不断变化,从小到大。看着三个山峰变成两个,最终变成一个。


KDE 在每个数据点放置一堆“概率”。随着带宽的扩大,堆“坍塌”。当您从微小带宽开始时,每个数据值都会贡献自己的离散堆。随着带宽的增长,这些桩坍塌并合并并相互叠加(粗蓝线),最终成为一个桩。一路上,最大值从起始值不连续变化n(假设内核有一个最大值,几乎总是这样)1. 临界宽度k最大值是将 KDE 减小为曲线的第一个(最小)宽度,不超过k最大值。