在运行决策树时,我的数据不平衡。数据余额为 93%(0 级)至 7%(1 级)。
现在,当我绘制决策树以了解导致 1 类的因素时,我发现大多数框都是 0 类(因为它是 97% 的数据)。
此外,修剪后,很少有贡献者对第 1 类有贡献。我怎样才能得到对第 1 类有贡献的因素?
在运行决策树时,我的数据不平衡。数据余额为 93%(0 级)至 7%(1 级)。
现在,当我绘制决策树以了解导致 1 类的因素时,我发现大多数框都是 0 类(因为它是 97% 的数据)。
此外,修剪后,很少有贡献者对第 1 类有贡献。我怎样才能得到对第 1 类有贡献的因素?
你在 Loss 使用哪个功能?在处理不平衡的数据集时,使用正确的方法很重要。7% 是不平衡的,但还不错。
您是否尝试过任何可解释的人工智能 (XAI) 方法?通常我使用夏普。很高兴看到哪个功能在哪个方向上有所贡献。你可以在这里看到一个例子。

你可以在这里查看 github
你可以在这里查看论文