我正在尝试用一个序列训练一个 lstm 并获得整个序列的序列分类。
我有不同长度的序列,所以我有一个输入神经元,我一次喂一个项目。这不是正确的解决方案吗?
我的问题是我正在使用单个理想输出来训练这些输入中的每一个,但是某些序列存在于具有其他理想输出的其他序列中。
因此,当我用 1,0 和 0.83 用 1,0 和 0.32 用 1,0 训练时,它会用 0、1 类训练。但是当我用 0.74 0.83 0.32 和 0,1 训练时,训练会发散到无穷大,因为我为同一个输入分配了两个不同的类。
当某些元素跨序列处理时,我应该如何用序列训练 lstm?除非有另一种方法来训练当序列长度不同时具有 lstm 的深度网络?