时间序列预测

数据挖掘 时间序列 特征选择
2021-10-07 02:05:24

我试图从另一个预测一个时间序列。我的方法是基于移动窗口。我从以下特征预测系列的输出值:源系列的前一个值和 6 个过去的值。

添加时间序列的先前值是否有用?

我觉得我没有使用曲线中包含的所有信息来预测期货价值。但我不明白如何使用所有以前的数据来预测一个值(首先,特征的数量会随着时间的推移而增长......)。

6 个月时间窗口方法的注意事项是什么?

有没有关于时间序列特征选择的不同方法的论文?

2个回答

让我给你一些时间序列分析的简单方法。

第一种方法包括使用时间序列的先前值 如在 =φ1-1+...+φn-n. 如果您不知道,这些模型称为自回归 (AR) 模型。这回答了你的第一个问题。当然,包含时间序列的先前值很有用。有一整套基于这个想法的模型。

第二种方法是采用一个窗口并提取一些特征来描述每个时间点的时间序列。然后,您可以像通常那样使用传统的机器学习技术来预测未来值。这在分类或回归设置中更为常见,但未来值可以被认为是对未来值进行分类。尽管您通常会丢失与时间相关的特征,但这种技术具有显着减少特征数量的优势。这解决了您的第二个问题。

对您的情况可能有帮助的另一个模型是向量自回归模型 (VAR)(使用Wikipedia的符号):

(是的1,是的2,)=(C1C2)+(一个1,1一个1,2一个2,1一个2,2)(是的1,-1是的2,-1)+(e1,e2,)

在这里你可以看到 是的1, 有来自其先前值的贡献 1,-1 还包括其他系列的价值 是的2,-1在线性组合中。像往常一样,目的是找到一个一世,j 最小化观察值和估计值之间的某种误差度量。

一般建议:您需要做的第一件事是测试您的第一个系列的自相关,以确认自回归方法是否合适,然后测试两个系列之间的互相关以支持使用第二个系列改进的想法你的预测是正确的。

我自己对此很陌生,但最近花了很多时间学习时间序列,希望我能帮助其他学习者。如果我有评论的声誉,我会先问你几件事,但我不能。如果您回复或编辑您的问题,我会很乐意做进一步的工作并编辑此回复。有了这些警告:

使用以前的值作为特征有用吗?

我要说的第一件事是,要在数据中查看的正确方面在很大程度上取决于数据的性质,以及您试图用它做什么:

  • 听起来你有每月的价值,但不清楚你想要预测多远的未来,或者你可以访问多少历史数据。
  • 我们也不知道这两个系列代表什么,或者为什么要使用一个时间序列来预测另一个 - 如果没有这个,我认为没有人能够告诉您该系列的先前值是否是预测是否是有价值的信息。

使用 6 个月的时间窗口有什么注意事项吗?

仅使用过去 6 个月的一个明显警告是,如果在长达一年的时间内有任何季节性,那么您将错过它。

  • 如果您不确定:如果您有多年的信息,请尝试绘制您想要预测多年的系列。您很可能能够看到该系列在一年中的某些时间通常是增加还是减少。如果你可以在这里分享这个情节,它可能会帮助人们更深入地回答你的问题。

至于关于这种时间窗口方法的警告,我从你的帖子中不太清楚你使用什么算法来预测值。有关这方面的更多信息会有所帮助;您可能不应该质疑要选择哪些特征,而应该质疑使用什么方法进行预测。

有助于进一步阅读?

一旦您提供了更多信息,如果可以的话,我很乐意回答您关于合适阅读的最后一个问题。现在,我会说有很多可用的信息,但其中很多是学术性的。很多时候,论文不容易消化,似乎相互矛盾,或者只与特定情况相关。这是一个快速发展和变化的领域,因此有时很难找到明确的最佳实践或共识意见。

也就是说,可能值得查看一些免费的在线课程,看看是否可以帮助您了解您感兴趣的领域: