我目前正在研究机器学习中的 Boosting 技术,我碰巧了解到,在像 Adaboost 这样的算法中,每个训练样本都被赋予一个权重,具体取决于它在顺序提升中是否被先前的模型错误分类。
尽管我直观地理解,通过加权示例,我们让模型更加关注以前错误分类的示例,但我不明白机器学习算法“如何”考虑权重。权重是否被视为一个单独的特征?我想知道“如何”一个简单的机器学习模型,比如说一个决策树,理解一个特定的例子承载更多的权重,因此需要给予更多的关注/正确分类。
有人可以用简单的文字/方程式向我解释机器学习算法如何处理加权训练样本吗?他们如何强迫自己正确分类权重较高的样本?是否应该对现有的 ML 算法进行修改以考虑权重?