如何建立残差回归模型

数据挖掘 机器学习 scikit-学习 回归
2022-02-25 09:32:36

假设您有一个性能良好的回归模型,但最终结果还不止于此。

我遇到的一个提高模型性能的想法是使用第一个模型的残差(y - y_pred)在顶部构建第二个模型。该模型将假设了解第一个模型对哪些观察结果预测过高或预测过低。然后,第二个模型的结果将与第一个模型一起用于改进预测。

有没有人尝试将其实施到回归任务中?是否有任何我想念的资源成功实现了这一点?

以下是我的一些问题:

  • 第二个模型是否应该只对残差进行训练?还是残差+特征?
  • 在 a 中实现这一点的总体最佳实践应该是什么sklearn pipeline
1个回答

我认为您所描述的可以与回归的梯度提升进行比较。那里的概念与您所描述的相似->您将一个简单的基本模型迭代地拟合到您的回归任务中,然后尝试将下一个模型拟合到您所拥有的错误中,以解释您的第一个模型的不确定性。这通常由决策树完成,因此不能直接与线性回归进行比较,但您可能会发现深入研究这个概念很有用(尤其是已经有很多包在 Python 和 R 中实现它)