我一直在尝试了解如何表示和塑造数据以使用 Keras(或 TensorFlow)进行多维和多变量时间序列预测,但在阅读了许多关于如何在正确的形状(大多数示例略少
我的数据集:
- 几个城市
- 我有关于温度、汽车交通、湿度的信息
- 比如说过去 2 年(每天一条记录)
我想做什么: 我想使用可能滞后的温度、汽车交通和湿度来预测每个城市明年的温度(当然还有更多功能,但这只是一个思考的例子)。
我感到困惑的是: 如果我有 2 个城市,我为此记录了 365 天的 3 个特征。我应该如何塑造我的输入,以便模型可以输出这两个城市的 365 天预测(即 365 天的 2 个温度时间序列)?
直观地说,张量形状将是(?, 365, 3)
365 天和 3 个特征。但是我不确定在第一个维度中要坚持什么,最重要的是,如果它必须是城市的数量,我会感到惊讶。但与此同时,我不知道如何在模型中指定它必须正确理解尺寸。
任何指针都会有所帮助。我对问题的其余部分非常熟悉(即如何在 Keras 中构建网络等,因为我已经为其他神经网络做过这个,但更具体地说,如何最好地为所需的输入编码序列。)
哦,还有,我想我可以为每个城市独立训练和预测,但我相信每个人都会同意,可能有一些东西需要学习,这些东西并不是任何城市特有的,但只有考虑其中几个才能看到,因此,为什么我认为在模型中对其进行编码很重要。