使用 xgboost 进行序数分类

数据挖掘 xgboost
2021-10-14 05:59:12

我正在解决因变量是有序类的问题,例如bad, good, very good

我怎么能声明这个问题xgboost而不是正常的classificationor regression

谢谢

2个回答

我认为您可以使用回归设置,例如 bad=0, good=0.5, very good = 1 用于标签,然后是 XGBoost 的后处理输出,例如 pred_value < 0.25 => prediction_label=bad, pred_value >= 0.25 和 pred_value < 0.75 => prediction_label=good 等等。

您可以运行 2 个 xgboost 二进制分类器

  • 1 个分类器对样本进行分类(好或非常好)
  • 2 分类器分类如果样本非常好

  • 如果在看不见的数据上两者都是正确的,则归类为非常好

  • 如果只有第一个是真的,第二个是假的都归类为好 假=> 归类为坏