使用另一个分类模型作为模型输入的最佳方式是什么?

数据挖掘 机器学习 深度学习
2022-02-18 22:26:57

假设我有一个分类模型。我的工作是从 30 个不同的类别中预测出正确的类别。当前准确度为 60%。

问题是:我必须消耗另一个团队的分类结果,准确率达到 80%。所以我使用他们的预测结果作为一个特征。我称之为“黄金特征”。假设我的目标是使用黄金特征 > 80% 的准确度。

这是我目前的方法:

(我正在使用深度学习。)我有几个特征,每个特征都有自己的权重。我还为“黄金特征”的一个热向量(1 x 30)创建了一个权重向量,并将所有权重一起训练。然而,结果似乎并没有提供太多。

我思考了原因并意识到学习向量(30 x 30)不会那么有意义。它们只是正数。(如果我的推理有误,请骂我!)

有没有人遇到过类似的问题?任何建议将不胜感激!您建议的方法不一定是深度学习方法。

1个回答

您正在描述ensembling,梳理模型的集合。

可以在您的情况下应用的最常见的集成设计模式是:

  • Stacking - 模型的输出成为另一个模型的输入。

  • Bagging - 每个模型对最终结果进行投票。