有人可以给我一个非数学直觉,为什么 Bootstrap 聚合会减少过度拟合?
从我的角度来看,我们没有提供任何额外的信息,我们并没有真正延长观察次数。
有人可以给我一个非数学直觉,为什么 Bootstrap 聚合会减少过度拟合?
从我的角度来看,我们没有提供任何额外的信息,我们并没有真正延长观察次数。
这是一种在集成决策中所谓的弱学习器(参见参考资料)的现象会产生良好的性能。Dietterich在这里解释了这个原因:
单个分类器产生的不相关错误可以通过投票来消除。
该声明的进一步解释或理论证明可能是一个开放的研究问题。
为了说明为什么平均会降低标准偏差并使预测更准确,我将举一个例子。
假设我们有两个模型。预测是随机变量 即预测有一个平均值加上一个误差项。
考虑到误差不相关,平均值为:
这也是正态分布的,平均值为和标准差
即我们能够在减少标准偏差的同时保留相同的平均值。
话虽如此,实际上误差具有一定的相关性,我们可以实现方差减少,但通常它有一些限制,不能通过增加集合大小来减少到零。