GBM 算法如何处理缺失数据?

数据挖掘 xgboost 缺失数据 lightgbm
2021-10-15 03:44:09

GBM 算法(例如 XGBoost 或 LightGBM)如何处理 NaN 值?我知道他们学习如何用其他值替换 NaN 值,但我的问题是:他们是如何做到的?

1个回答

LIGHTGBM将在拆分期间忽略缺失值,然后将它们分配给减少损失最多的一方。本参考资料的第 3.2 节对此进行了解释。

您可以设置一些选项,例如 usemissing=false,它会禁用对缺失值的处理。您还可以使用 zeroas_missing 选项来更改行为。GitHub