我使用有状态的 LSTM 进行股票市场分析,每只股票都有不同数量的数据,从 20 年到几周不等(即新上市股票)。
我至少使用 3 年的数据进行训练,因为我想在网络中创建一些状态。我设置了一年作为我的序列长度,所以如果我有 12 年的数据,那么我将提交 4 个批次,每个批次有 3 个序列。只有在我提交了所有批次之后,我才会重置网络状态,为下一个库存做好准备。
但是对于不同数量的序列进行训练有什么问题吗?例如,如果我在一家拥有 20 年数据的公司进行培训,那么网络将建立比我只有 3 年数据的公司更多的状态。