如何处理 XGBoost 中高估小值和低估高值的问题?
数据挖掘
机器学习
xgboost
2022-02-22 21:29:11
2个回答
我认为它不一定与执行回归的算法类型(此处为 XGBoost)有关 - 但与回归算法的固有性质有关。
许多损失函数旨在减少之间的距离和.
这可能导致模型预测分布更加紧密的意思。
我会检查几件事来验证这一点:
1)比较真实的分布并预测.
2) 在其他回归模型上验证此错误模式。
我会尝试改善结果的事情:
1)在训练集中对样本低/高y值进行采样。
2)调整损失函数,使低/高y值的错误权重更大。
3)寻找强调低/高y值的特征并更好地设计它们。
也许您可以尝试使用多个 XgBoost 模型而不是 1 个模型,并对它们的预测取平均值(或加权平均值)。
其它你可能感兴趣的问题
