哪种在线机器学习技术可用于具有多个输入的多类分类问题?

人工智能 机器学习 人工智能设计 分类 多层感知器 在线学习
2021-11-16 01:27:17

我有以下问题。我们有4单独的离散输入,它可以取之间的任何整数值6363. 输出也应该是一个离散值6363. 另一个限制是该解决方案应该允许使用奇异值或小批量进行在线学习,因为数据集太大而无法将所有训练数据加载到内存中。

我尝试了以下方法,但预测并不好。

我创建了一个 MLP 或前馈网络4输入和127输出。输入在没有标准化的情况下被馈送。隐藏层数为4[8,16,32,64]每个(分别)的单位。因此,本质上,这将问题视为序列分类问题。对于训练,我们将非归一化输入与该特定值的 one-hot 编码向量一起作为输出提供。推理以同样的方式完成。找到最热的输出并将其作为序列中的下一个数字返回。

2个回答

我建议使用数据流算法来尝试解决您的问题,因为您要求“使用奇异值或小批量进行在线学习,因为数据集太大,将所有训练数据加载到内存中。”

MOA是这些算法的不错选择。Hoeffding Trees也是一个不错的首选尝试。

如果您更喜欢使用 Python(而不是用于实现MOA的 Java,这是在另一个答案中建议的),您可能需要查看 Python 的creme库,其 API 在https://creme-中进行了描述ml.github.io/api.html,这是一个用于增量和在线学习的库。特别是,您可能对课程感兴趣OneVsRestClassifier