不平衡数据的决策树

数据挖掘 机器学习 r 决策树 阶级失衡
2022-02-12 17:43:29

在运行决策树时,我的数据不平衡。数据余额为 93%(0 级)至 7%(1 级)。

现在,当我绘制决策树以了解导致 1 类的因素时,我发现大多数框都是 0 类(因为它是 97% 的数据)。

此外,修剪后,很少有贡献者对第 1 类有贡献。我怎样才能得到对第 1 类有贡献的因素?

1个回答

你在 Loss 使用哪个功能?在处理不平衡的数据集时,使用正确的方法很重要。7% 是不平衡的,但还不错。

您是否尝试过任何可解释的人工智能 (XAI) 方法?通常我使用夏普。很高兴看到哪个功能在哪个方向上有所贡献。你可以在这里看到一个例子。 形状解释