当将直方图视为对密度函数的估计时,将 bin 大小视为约束该函数局部结构的参数是否合理?
另外,有没有更好的方法来表达这种推理?
当将直方图视为对密度函数的估计时,将 bin 大小视为约束该函数局部结构的参数是否合理?
另外,有没有更好的方法来表达这种推理?
是的,我认为这个想法是将直方图视为Kernel Density Estimation的一个特例。在这种情况下,KDE 成为直方图的核函数是指示函数。在这种情况下,bin 大小等于 KDE 的带宽。
KDE 的带宽确实是一个规律性度量:带宽非常高的 KDE 有很大的偏差(他们说分布是均匀的),而带宽非常低的 KDE 有很大的方差(它们适应训练数据但不能很好地泛化)。由于 KDE 的带宽等于 bin 大小,我们可以说 bin 大小是一种规律性度量。