我的问题主要是关于一般直觉逻辑:当使用 RNN (LSTM) 预测时间序列时,您的目标是,例如,预测100 steps ahead一系列one single feature,什么样的配置对层有意义一个简单input | hidden | outputRNN 的大小和窗口大小(假设你想看不止一个点,所以你选择一个“窗口”/“间隔”?
更确切地说:
- 只使用 1 个输入神经元,一次只看一个点,还是选择一个窗口/间隔?- 显然,仅查看 1 点,您就完全依靠网络的内存方面来检测有用的模式……这会是一件好事吗?
- 使用窗口时,使用一组重叠窗口是否有意义,例如。一次滑动一个 10 点的窗口,还是不重叠的窗口?
- 隐藏层中的单元数量是否应该大致等于您打算提前预测的步数?(另外,与窗口大小和提前预测的步骤之间的关系类似)
或者,如果回答这个问题太难或太费时间,从哪里可以得到回答这些问题的直觉?
(因为显然可能的配置空间是巨大的,除非你有大量的时间或资源,否则你需要一些直觉,这样你才能开始形成一个“大致有效”的配置......)