我有 11 个类的不平衡数据集,其中 1 个类是 30%,其余的在 5-12% 之间。我不是铁杆程序员,所以我使用的是来自https://www.h2o.ai/的产品。我使用了 GBM 和 DRF,并使用了平衡类的选项,并且根据混淆矩阵,训练结果非常好(98-99% 的精度和召回率)但是当我在验证集上对其进行测试时,这是我获得准确率的唯一类是 30% 的类别,所有其他类别的分类错误接近 100%。不知道我应该采取什么方法。这 11 个类别是 11 个细分市场,甚至每个类别的准确度约为 70% 对我来说也是可行的。
编辑 1:附加信息:验证模型将几乎每个样本预测为 30% 类,即为什么接近 30% 的准确度......类似于信用欺诈检测出错......
更新 1:所以我尝试了另外 2 种方法
1) 试图通过将除 30 % 类别以外的所有内容标记为“其他”来使其成为 2 类分类,但结果仍然很差
2)我删除了 30% 的类并保持其他 9 个不变,然后训练了一个 GBM,结果非常准确,测试和验证之间的比例为 85%-15%。但是,一旦我进行交叉验证,分类就真的很差。
不知道发生了什么……也许我需要重新考虑我的整个方法并重新定义问题并提出一个完全不同的假设。