使用 MinMax 或 Log Return 归一化来预测股价走势是否更好?

数据挖掘 时间序列 lstm 正常化 特征缩放
2022-02-13 16:45:53

我正在尝试使用 LSTM 模型来预测 d+2 和 d+3 的收盘价。我不确定是否应该规范化数据

  • 使用 MixMax 缩放器 (-1,+1)

  • 使用日志返回

  • 每个样本的 (P(n)-P(0))/P(0)

我已经尝试了很多来自 Github 的源代码,但它们似乎没有融合任何技术。

1个回答
  1. 与百分比变化相比,对数回报是对称的。log(a/b) = - log(b/a)从理论上讲,这(偏度较小)可以为大多数模型(线性回归、神经网络)带来更好的结果。
  2. 如果值接近零,像 lstm 这样的神经网络会更好地工作,但归一化的差异通常不会那么大。
  3. 任何回报(对数或百分比)都优于原始值,因为价格会根据之前的价格而变化。与之前的价格相比,它们的绝对(原始)值的影响几乎可以忽略不计。

我建议首先转换为对数返回,然后进行规范化。如果是每日价格,那么我会将日志收益除以 0.05。价格变化在分布中具有非常重的尾部,所以我不建议使用 minmax,因为那样你除以 0.5(可能处于大萧条时期)并且所有值都太接近于零。除以标准偏差也应该是好的。

但现实与理论不同,因此最好进行基准测试。也许百分比变化会更好,因为这是人们看到并做出反应的数字。市场在很大程度上与心理学有关。

并准备好看到非常高的错误和糟糕的模型。金融市场在实践和理论上都很难预测。根据经济理论,如果它们是可预测的并且人们是理性的并且拥有无限的信用额度,那么与整个市场相比,任何赚取额外资金的可能性都将在几毫秒内关闭。只有当您找到某种方法来分析当前没有人使用的数据时,您才能赚钱。神经网络在 1990 年代被讨论以预测金融市场。所以 LSTM 在 2018 年并不是真正的新事物。