对于大量类,什么是好的分类算法?

信息处理 分类 机器学习
2022-02-04 22:10:55

我的要求是这些:

  • 将长度为 100 的向量快速分类到 30000 个类别之一
  • 迭代学习(可以在第一次学习后改进模型)
  • 最好在 Matlab 和 Java 中可用的实现

谢谢

3个回答

我建议使用深度学习,尤其是卷积神经网络。这可能是大规模分类任务的通用方法。一个这样的例子是识别面孔。例如,Sun 等人已经处理了 10.000 个类。人。在以下:http: //ieeexplore.ieee.org/document/6909640/

当然支持迭代学习。

嗯,这取决于类的性质。就个人而言,我更喜欢 SVM,因为它易于使用并且可以正常工作(不是那么快)!您也可以使用 k-means 方法(但它真的很slooooooooooooooooooow,尤其是对于这个数量的类)。另一个值得研究的分类器是 Adaboost,他们说它很快 :)

玩得开心...!

您是否考虑过多重 sigmoid 回归?它的偏导数有一个分析简化,使迭代算法变得简单。你可以很容易地自己实现它们。