我可以组合两个产生不同类型错误的分类器以获得更好的分类器吗?

人工智能 分类
2021-10-19 14:05:12

我有一个包含 2,23,586 个样本的数据集,其中 60% 用于训练,40% 用于测试。我分别使用了 5 个分类器,SVM、LR、决策树、随机森林和增强决策树。SVM 和 LR 表现良好,准确率接近 0.9,召回率也为 0.9,但基于树的分类器报告准确率为 0.6。经过仔细观察,我发现 SVM 和 LR 预测的 20,357 个样本的标签并不完全相同。那么我可以申请投票并解决这个预测结果的冲突吗?这种冲突可能是由于数据集不平衡造成的吗?

1个回答

是的你可以。有很多不同的技术,通常称为集成方法

更好的方法可能是使用AdaBoost之类的方法以及您查看的决策树等更便宜的方法。AdaBoost 明确地尝试训练分类器正确处理数据的不同部分,而不是希望不同的方法偶然地这样做。