数据挖掘 - 不平衡数据的决策树 - 吾爱随笔录

数据挖掘机器学习 r 决策树阶级失衡

2022-02-12 17:43:29

在运行决策树时，我的数据不平衡。数据余额为 93%（0 级）至 7%（1 级）。

现在，当我绘制决策树以了解导致 1 类的因素时，我发现大多数框都是 0 类（因为它是 97% 的数据）。

此外，修剪后，很少有贡献者对第 1 类有贡献。我怎样才能得到对第 1 类有贡献的因素？

1个回答

你在 Loss 使用哪个功能？在处理不平衡的数据集时，使用正确的方法很重要。7% 是不平衡的，但还不错。

您是否尝试过任何可解释的人工智能 (XAI) 方法？通常我使用夏普。很高兴看到哪个功能在哪个方向上有所贡献。你可以在这里看到一个例子。

其它你可能感兴趣的问题