我想知道是否有人对来自多个来源的数据的时间序列预测有经验。因此,例如,时间序列每个都有自己的形状,有些可能与其他的相关。最终目标是训练一个模型,以便可以预测任何给定数据源
我个人有两种理论上可行的解决方案,但想知道是否有人知道其他常用方法。
使用 LSTM 进行多任务学习
使用特征工程将每个时间序列源的属性与常用特征一起建模为特征,并将这些与 LSTM 一起使用
我想知道是否有人对来自多个来源的数据的时间序列预测有经验。因此,例如,时间序列每个都有自己的形状,有些可能与其他的相关。最终目标是训练一个模型,以便可以预测任何给定数据源
我个人有两种理论上可行的解决方案,但想知道是否有人知道其他常用方法。
使用 LSTM 进行多任务学习
使用特征工程将每个时间序列源的属性与常用特征一起建模为特征,并将这些与 LSTM 一起使用
我只知道(并使用)一个 RNN,它在第一层获得多个时间序列,然后在后续层中混合这些时间序列。如果您对这种方法有任何疑问,请告诉我。
对于这种方法,您当然可以使用 LSTM,也可以使用 VAR,或者可能是更“传统”的模型(随机森林)。我已经在 Keras 中实现了用于 t+x 预测的多变量 LSTM。特征工程肯定有助于改善结果。
我也使用了 VAR,与 LSTM 相比,我对它的有效性感到惊讶。Python 和 R 中有用于 VAR 的包。
或者,如果您的特征有效地描述了不一定依赖于时间分量的模式,则可以使用更传统的方法,例如随机森林。可能不如 VAR 或 LSTM 有效,但它很快。
答案是数据融合或特征融合。
我正在使用神经网络实现一个使用多种传感器对人类活动进行分类的方法:加速度计、二进制传感器、ecc ..
我们训练一个具有多个输入层的神经网络:每个数据源一个。
前向传播将这些分开,直到网络更深,此时我们将特征表示连接起来,然后在网络中继续进行单个合并的处理管道,该管道以单个分类层结束。
我们可以将其视为每个独立的管道学习其数据源的特征表示,然后可以有效地与其他表示组合以执行分类。
这保持了每个网络分支的独立性(例如,您可以让 LSTM 处理顺序数据,然后将其潜在状态向量与来自 CNN 的 FC 特征连接起来,将压力板测量值作为图像处理,等等)。