谁能解释一下 bagging 和 boosting 之间的基本区别以及在哪种情况下可以使用哪种技术?
bagging 和 boosting 的区别
数据挖掘
数据集
集成建模
采样
集成学习
2022-03-10 03:41:26
1个回答
Bagging:也称为 Bootstrap Aggregation 是一种集成方法。首先,我们创建训练数据集的随机样本(训练数据集的子集)。然后,我们为每个样本构建一个分类器。最后,使用平均或多数投票组合这些多个分类器的结果。Bagging 有助于减少方差误差。
Boosting提供了预测变量的顺序学习。第一个预测器是在整个数据集上学习的,而以下是基于前一个预测器的性能在训练集上学习的。它首先对原始数据集进行分类并对每个观察值赋予相等的权重。如果使用第一个学习器错误地预测了类,那么它会赋予错过的分类观察更高的权重。作为一个迭代过程,它会继续添加分类器学习器,直到模型数量或准确性达到限制。Boosting 显示出比 bagging 更好的预测准确性,但它也倾向于过度拟合训练数据。
算法适用于这些技术
Bagging:随机森林
提升:Ada Boost、梯度提升、XGBoosting 等
其它你可能感兴趣的问题