关于梯度提升,我不明白的是,降低树的高度是否意味着我们在模型中使用更少的特征?
从我的模型中,当深度为 1 时,我得到最高精度。这意味着我的树上只有根节点,并且使用一个功能。使用一个特征的模型如何提供这样的准确性?
关于梯度提升,我不明白的是,降低树的高度是否意味着我们在模型中使用更少的特征?
从我的模型中,当深度为 1 时,我得到最高精度。这意味着我的树上只有根节点,并且使用一个功能。使用一个特征的模型如何提供这样的准确性?
我发现很难想象基于树的提升是如何工作的。我认为有两个重要组成部分:
xgboost文档附带了关于 boosted trees的一个很好的介绍。
“统计学习要素”的第 10 章介绍了 boosting。值得一看。下面是本书介绍的 AdaBoost 例程。
还有其他增强方法不适用于树。这是一个简单的 L2 提升例程,在R.
在 boosting 中,通过将高偏差和低变体模型相加组合来集成低偏差和低方差模型。在这里,偏差逐渐减少,同时保持较低的方差。因此,具有高度偏差的单一深度的树不是问题,因为加性误差会减少。