我有几个与集成学习中的弱学习者密切相关的问题(例如提升)。
- 这听起来可能很愚蠢,但是使用弱学习器而不是强学习器有什么好处?(例如,为什么不使用“强”的学习方法来提升?)
- 弱学习器是否有某种“最佳”强度(例如,同时保持所有其他集成参数固定)?当谈到他们的实力时,是否有一个“甜蜜点”?
- 我们如何衡量弱学习器相对于所得集成方法的强度。我们如何定量测量使用集成的边际收益?
- 我们如何比较几种弱学习算法来决定将哪一种用于给定的集成方法?
- 如果给定的集成方法对弱分类器的帮助大于对强分类器的帮助,我们如何判断给定的分类器已经“太强”而无法在使用它进行提升时产生任何显着收益?