直方图中的“bin size”可以被认为是一个规律性约束吗?

数据挖掘 机器学习 统计数据 可视化 可能性 正则化
2022-02-15 23:52:04

当将直方图视为对密度函数的估计时,将 bin 大小视为约束该函数局部结构的参数是否合理?

另外,有没有更好的方法来表达这种推理?

1个回答

是的,我认为这个想法是将直方图视为Kernel Density Estimation的一个特例在这种情况下,KDE 成为直方图的核函数是指示函数在这种情况下,bin 大小等于 KDE 的带宽。

KDE 的带宽确实是一个规律性度量:带宽非常高的 KDE 有很大的偏差(他们说分布是均匀的),而带宽非常低的 KDE 有很大的方差(它们适应训练数据但不能很好地泛化)。由于 KDE 的带宽等于 bin 大小,我们可以说 bin 大小是一种规律性度量。