机器算法验证 - Silverman (1981) 所说的“临界带宽”是什么意思？ - 吾爱随笔录

Silverman (1981) 所说的“临界带宽”是什么意思？

机器算法验证计量经济学内核平滑

2022-03-29 10:57:48

在为核密度估计器选择带宽时，根据我的理解，关键带宽是：

“对于每个整数 k，其中1<k<n，我们可以找到最小宽度h(k)，使得核密度估计最多具有 k 个最大值。Silverman 将这些h(k)值称为“临界宽度”。

我不直观地理解这个概念。任何帮助，将不胜感激。

谢谢！

2个回答

如果你有一个非常宽的带宽，你会在你的 KDE 中获得一个峰值。如果你减少一点，它仍然是一个峰值。继续减少它，直到达到添加第二个峰值的切换点。该带宽是 $h(1)$ .

现在让它更小，直到你在两个峰值和三个峰值之间切换。那是 $h(2)$ .

等等。

在之间的任何带宽 $h(i-1)$ 和 $h(i)$ 你将会有 $i$ KDE 中的峰值。

西尔弗曼想要为那一套命名 $h$ -价值观；他称它们为临界带宽。

例如，这出现在他的多模态测试中。

我讨厌网页中的动画，但是这个问题需要一个动画的答案：

这些是一组三个值（接近 -2.5、0.5 和 2.5）的 KDE。它们的带宽不断变化，从小到大。看着三个山峰变成两个，最终变成一个。

KDE 在每个数据点放置一堆“概率”。随着带宽的扩大，堆“坍塌”。当您从微小带宽开始时，每个数据值都会贡献自己的离散堆。随着带宽的增长，这些桩坍塌并合并并相互叠加（粗蓝线），最终成为一个桩。一路上，最大值从起始值不连续变化 $n$ （假设内核有一个最大值，几乎总是这样） $1.$ 临界宽度 $k$ 最大值是将 KDE 减小为曲线的第一个（最小）宽度，不超过 $k$ 最大值。

其它你可能感兴趣的问题

上一篇How to estimate P(x≤0)P(x≤0)nnxx 下一篇具有对数转换数据的线性回归 - 大错误