我有以下问题。我们有单独的离散输入,它可以取之间的任何整数值和. 输出也应该是一个离散值和. 另一个限制是该解决方案应该允许使用奇异值或小批量进行在线学习,因为数据集太大而无法将所有训练数据加载到内存中。
我尝试了以下方法,但预测并不好。
我创建了一个 MLP 或前馈网络输入和输出。输入在没有标准化的情况下被馈送。隐藏层数为和每个(分别)的单位。因此,本质上,这将问题视为序列分类问题。对于训练,我们将非归一化输入与该特定值的 one-hot 编码向量一起作为输出提供。推理以同样的方式完成。找到最热的输出并将其作为序列中的下一个数字返回。