数据挖掘 - class_weight 是否解决了决策树的不平衡输入？ - 吾爱随笔录

数据挖掘 scikit-学习决策树阶级失衡

2022-03-05 05:31:53

我在 sklearn 的文档中读到，我们必须特别注意平衡决策树的输入，但它并没有告诉您使用什么函数。但是，我找到了参数class_weight。如果我class_weight: balanced用作参数，这是否意味着我可以省略手动平衡输入？

2个回答

是的，您不需要手动平衡您的火车数据。但是您的测试数据仍然可能（真正）不平衡。

对于分类问题，不仅仅是决策树，不平衡类给出过于乐观的准确度分数并不少见。有几种常见的方法来处理这个问题。

我还建议您将这些技术结合起来。例如，给你的模型一个先验并使用 F1 分数。我想你会在这条路上找到好的结果。

其它你可能感兴趣的问题