关于 Xgboost 纸张重量和决策规则的问题

机器算法验证 机器学习 正则化 助推
2022-04-18 19:17:52

来自 Xgboost 论文

谁能解释一下重量w正在做什么以及它是如何在这里工作的?我也不明白怎么q变换一个m维向量T.

编辑

usεr11852 的回答很好。我还建议任何提到这个问题的人参考这个详细的解释。它应该为大多数关于提升的问题画上句号。

1个回答

使用(回归)树进行提升的基本思想是我们正在学习函数f(这里以树的形式wq(x))。权重wT树的叶子代表预测k-th 树。 q是树结构(例如,只有一个根节点的树桩,或 12 层深的精细树的结构); q独立于实际的提升过程,但它会影响我们集成的性能(这就是为什么我们使用诸如max_depth控制它的参数之类的原因)。通过定义的结构q我们的mxi映射到包含权重的叶子w. 一棵树内q,w本身可以带T 不同的值,其中T是树中的叶子数。加起来所有wk从我们的K树学习器为我们提供了最终估计y^.

如果它有帮助,我们可以继续将公式 1 扩展为:

y^i=k=1Kwqk(xi),wqRTk

很明显,为了得到我们的最终预测,我们将权重相加wk由树结构决定qk.

最后,请注意,当我们检查回归树时,基于我们试图最小化的目标函数,我们能够将回归树用于许多不同的任务。例如,使用逻辑损失很自然地适用于分类任务,而折扣累积增益导致排名应用程序。