LightGBM 如何处理增量学习(和概念漂移)?

机器算法验证 助推 概念漂移
2022-03-23 05:45:14

通过一些研究,我发现它会更新叶子(不会创建新叶子或删除旧叶子),对吗?这是怎么发生的?

另一个问题是,当在概念转换数据中进行增量学习时,LightGBM 是否可以很好地处理这个问题?

1个回答
  1. 如果我们update通过持续的训练(例如通过BoosterUpdateOneIter),LightGBM 将添加更多的树。假设我们使用refit现有的树结构来根据新数据更新叶子的输出。它比从头开始重新训练更快,因为我们不必重新发现最佳树结构。尽管如此,请注意,几乎可以肯定,它的性能(在新旧数据的组合上)会比从头开始完全重新训练更差。
  2. 任何在线学习算法都将被设计为适应变化。也就是说,LighyGBM 的性能将取决于我们将使用的训练参数以及我们将如何验证我们的预测(例如,我们对忽略先前数据点的关心程度)。假设我们正确地训练了我们的助推器,而没有相关的基线(例如,以增量方式训练的岭回归),那么说“ LightGBM 是好(或坏) ”来处理概念漂移是没有意义的。