一次训练一个序列的 LSTM

机器算法验证 机器学习 分类 神经网络 lstm
2022-03-15 00:42:43

我正在尝试用一个序列训练一个 lstm 并获得整个序列的序列分类。

我有不同长度的序列,所以我有一个输入神经元,我一次喂一个项目。这不是正确的解决方案吗?

我的问题是我正在使用单个理想输出来训练这些输入中的每一个,但是某些序列存在于具有其他理想输出的其他序列中。

因此,当我用 1,0 和 0.83 用 1,0 和 0.32 用 1,0 训练时,它会用 0、1 类训练。但是当我用 0.74 0.83 0.32 和 0,1 训练时,训练会发散到无穷大,因为我为同一个输入分配了两个不同的类。

当某些元素跨序列处理时,我应该如何用序列训练 lstm?除非有另一种方法来训练当序列长度不同时具有 lstm 的深度网络?

1个回答

一次训练一个字符。除非字符相同并且具有不同的理想输出,否则它不应该发散。在这种情况下,请考虑使用 one-hot 向量而不是标量向量。这意味着如果 a、b 和 c 是您的字符,那么如果 a 是字符 1、0、0 是输入。