与 Azure ML 中的增强决策树相比,R 中的 xgboost 具有不同的结果

数据挖掘 r xgboost 天蓝色毫升
2022-03-15 17:28:09

我有一个小型数据集(4000 条记录,包含 10 个功能),我在 R 中使用了 XGBOOST 以及在 Azure ML 工作室中使用了 Boosted Decision Tree 模型。不幸的是,结果不同。我喜欢优化召回,我可以在 Azure 中选择它作为衡量标准,但在 R 中我不能这样做。

我在两个平台上都使用了相同的参数。我知道种子可能会有所不同,但我尝试了很多。与使用 R 模型相比,使用 Azure 模型对我的验证数据集有更好的回忆。

我想知道这两个平台中使用的方法背后是否存在很大差异导致我出现问题。

我还使用了没有帮助的交叉验证。任何见解都值得赞赏。

谢谢

1个回答

很难说,因为无法确切知道 Azure 在做什么。

  • 从他们共享的内容中,他们对连续特征进行分类;你可以尝试tree_method='hist'在 xgb 中更相似。
  • 我不知道 Azure 如何处理分类或缺失值。
  • 请务必设置 xgb 的max_depth=0and grow_policy='lossguide',因为您想使用它max_leaves来进行直接比较。

https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/two-class-boosted-decision-tree#usage-tips
https://docs.microsoft.com/en -us/azure/machine-learning/studio-module-reference/two-class-boosted-decision-tree#module-parameters