具有可变长度序列的批处理

数据挖掘 分类 喀拉斯 张量流 时间序列
2022-02-24 05:57:51

我有很多不同长度的时间序列。我想知道将它们拟合到双向 LSTM 模型的最佳实践是什么。问题是序列到序列的二进制分类。所以对于每个时间步,我想预测二进制类。

目前,我为每个数据框创建一个张量,形状为(1, None, #Features). 然后我将每个张量分别拟合到模型中。

将每个数据帧组合到形状的张量(#Time Series, None, #Features)并一次拟合它们会更好吗?这有什么不同吗?

还是采用滑动窗口方法并将一个时间序列拆分为较小的窗口会更好?

我无法指定时间序列的最大长度,所以我认为我不能pad-sequence从 Keras 使用。

1个回答

最佳实践是让双向 LSTM 的每个时间序列长度相同。

您说不指定最大长度,因此另一种方法是选择固定长度。如果数据太短,请填充。如果数据太长,修剪。