问题:如果我们关注回报而不是价格,网站使用 DL 和 LSTM 进行的(单变量)股票市场预测实际上效果不佳。什么是相对快速的解决方案?(或最重要的解决方案)
动机很简单。您可以在任何金融经济/计量经济学文本中找到它。作为起点,我们可以考虑随机游走模型(RW) 中描述的股票价格(对数价格):
pt=pt−1+ϵt
其中 是 iid 高斯噪声。那么ϵtE[pt+1|It]=pt
It代表时间的信息集,但在此模型中归结为所以对于 log return =我们有 对于所有tptrt=pt–pt−1E[rt+1|It]=0t
带走:价格是非平稳序列,未来价格的最佳预测因子是现在的价格,回报是固定的,它们的最佳预测因子为零。
候选预测模型必须以某种方式使用进行比 RW 更好的预测。通常最好尝试回报而不是价格,因为前者是固定的(广义上的)。It
在通常的可预测性定义下,价格是可以很好预测的,而回报则很难预测。所以你的证据是正常的。
机器学习也可以在金融领域得到卓有成效的应用,但击败 RW 远非简单。
注意:请注意,下面的一些评论涉及平衡或其他有趣的点;但是在这里我们必须只专注于预测。其他评论要求经验支持。关于最后一个请求,上面的故事是一个模型(理论),除任何细节外,它代表了金融中最古老的随机模型(Bachelier 模型: https://en.wikipedia.org/wiki/Random_walk#Applications ; https: //en.wikipedia.org/wiki/Bachelier_model)。RW 成为股票预测(以及其他资产)的基准模型。几十年来,在学术界和金融业提出了数百种预测模型。寻找可预测性的模型反驳 RW 条件,如。他们搜索了一些模型E[rt+1|rt,rt−1…]=0E[rt+1|It]≠0,然后在 MSE 或其他指标中击败 RW。然而,到目前为止,他们中没有人能击败所有数据集(所有国家/指数、所有股票/名称、所有数据频率、ecc)的 RW。因此,在这里引用特定文章来确认或拒绝回报可预测性是没有用的,这是一个无休止的实证辩论。此外,对于某些 RW 版本,我们可以在较弱的条件下放松高斯性和独立性,但上述基本含义仍然成立。最后,历史似乎是我最有力的经验证实上述基本 RW 含义在某种程度上与数据一致。因此,它仍然是解释为什么股票价格容易预测而回报很难预测的更简单和更有说服力的方法。
还有一点。一些交易者/分析师想要直接预测价格而不是回报。他们打算将这项工作作为预测下一个时期的价格方向而不是水平(这很容易)。这些人使用诸如“价格路径”之类的东西。这个目标与预测返回方向没有什么不同。然而,这些人没有意识到没有办法从非平稳和非遍历时间序列中推断出一些东西。