我有 10 个分类特征和一个多类目标。
训练数据包含相同的 10 个分类特征可能映射到不同目标类的行。
我应该选择满足以下标准的分类算法:
- 仅当预测输入与训练数据中存在的行示例匹配时,预测输出才应显示结果。(我不想对它从未接受过训练的输入做出假设,因为这个模型将处理人们在现实世界中的生活)
- 预测输出应该是与预测输入完全匹配的目标,按它们在训练数据中的频率排序,最高的为顶部的“最佳匹配”
我意识到这看起来可以通过数据库“轻松”解决,但我想使用分类和训练模型,而不是使用带有列、键、索引和其他无聊事物的繁琐数据库基础设施。