在高层次上,我看不出通过梯度提升获得的简单模型的集成如何优于单个更复杂的模型?做梯度提升而不是简单更复杂的模型有什么意义?下面两个具体场景:
在我阅读的一篇文章(Gradient boosting from scratch)中,有一个用于回归的简单树(树桩)集成的示例。那么为什么梯度提升的方法比单个更复杂的深度更大的树更好呢?
a)在线性回归的情况下,使用梯度提升似乎没有意义。有人可以解释为什么(或反驳)吗?这将有助于我理解回归和提升。例如,不要对许多特征(甚至可能是特殊的特征,如 LASSO)进行回归,而是对单特征回归进行连续迭代,通过梯度提升对它们进行分组。
b)同 2a,仅用于逻辑回归。我怀疑这可能是有道理的,因为计算的函数不是线性的。但是,为什么要使用逻辑回归而不是正则化逻辑回归来应用梯度提升呢?