时间序列预测的特征选择

数据挖掘 时间序列 特征选择 相关性
2022-03-07 04:35:21

我正在研究基于 LSTM 的股市预测问题,并试图找出一种选择输入变量的方法。

  1. 在计算变量之间的相关性(例如特斯拉的收盘价与微软的收盘价)时,区分曲线是否会给出更准确(或正确)的相关指数?我发现非微分变量的值在 0.7-0.9 范围内,微分后的值更低。

  2. 一旦我有了所有变量的相关矩阵,有没有办法找出哪些会向神经网络添加信息,哪些只会添加噪声?

1个回答

您无需选择输入网络的变量,深度神经网络 (DNN) 会自动执行此操作。实际上,DNN 通过设置权重来更加重视相关变量。设置权重后,隐藏节点有的取0,有的取1(因为sigmoid函数)。您也可以将此 1 和 0 视为选择相关变量。

顺便说一下,相关矩阵不能直接用来选择相关变量。如果要减少输入 DNN 的变量数量,可以使用 PCA。实际上 PCA 分量是通过获取相关矩阵的特征向量来计算的。