我目前正在做一个统计项目,我需要估计一个条件期望使用 Nadaraya-Watson 估计器。为此,我有样本, 在哪里,我选择了带宽这样:, 鉴于共同的经验法则是为最优。
但是,我不明白在什么意义上是最优的。确实,我正在使用 R,ksmooth带有normal内核的函数:ksmooth(X,Y,"normal",bandwidth=h)。如果我选择这样的:

例如,如果我选择等于 3(大约大 5 倍),我得到了一条更平滑的曲线,这才是我真正感兴趣的:

有人可以解释我在什么意义上是“最佳的”吗?
如果我选择一个,我会牺牲什么大于“最佳”之一:准确性、收敛速度等?
非常感谢,非常感谢。