是什么让 lightGBM 比 XGBoost 运行得更快?

数据挖掘 xgboost
2022-03-04 14:50:23

我很好奇实现上的哪些差异允许 lightGBM 比 XGBoost 加速,有时甚至达到数量级。

1个回答

首先,两种GBM方法都很好,每种算法的优越性都取决于数据。

两者的主要区别在于 LightGBM 使用基于梯度的单侧采样 (GOSS) 的新技术来过滤数据实例以找到分割值,而 XGBoost 使用预排序算法和基于直方图的算法来计算最佳值分裂。

GOSS 假设具有小梯度的数据点往往训练得更好。这意味着集中在具有较大梯度的数据点上更有效。为了减轻有偏样本的问题,它还从具有小梯度的数据中随机抽样。

要阅读更多内容,您可以参考: