何时在拟合 ARIMA 模型之前记录转换时间序列

机器算法验证 r 时间序列 数据转换 预测 有马
2022-02-10 21:24:14

我以前使用Forecast pro来预测单变量时间序列,但现在将我的工作流程切换到 R。R 的预测包包含许多有用的功能,但它没有做的一件事是在运行 auto 之前进行任何类型的数据转换.arima()。在某些情况下,预测专家决定在进行预测之前记录转换数据,但我还没有弄清楚原因。

所以我的问题是:在尝试 ARIMA 方法之前,我应该什么时候对时间序列进行日志转换?

/编辑:阅读您的答案后,我将使用这样的东西,其中 x 是我的时间序列:

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

这有意义吗?

4个回答

绘制数据与时间的关系图。如果看起来变化随着系列的级别而增加,请记录日志。否则对原始数据建模。

在继续之前的一些警告。正如我经常向我的学生建议的那样,auto.arima()仅将事物用作最终结果的初步近似值,或者当您检查您的竞争对手基于理论的模型是否做得更好时,您希望使用简约模型。

数据

您必须清楚地从您正在使用的时间序列数据的描述开始。在宏观计量经济学中,您通常使用聚合数据,而几何平均值(令人惊讶的是)对宏观时间序列数据有更多的经验证据,可能是因为它们中的大多数都可以分解成指数增长的趋势

顺便说一句,Rob 的建议“直观地”适用于具有明显季节性部分的时间序列,因为缓慢变化的年度数据对于变化的增加不太清楚。幸运的是,通常会看到呈指数增长的趋势(如果它看起来是线性的,那么就不需要日志了)。

模型

如果您的分析基于某种理论,即某些加权几何平均值 Y(t)=X1α1(t)...Xkαk(t)ε(t)众所周知,乘法回归模型是您必须使用的模型。然后你通常会转向一个对数回归模型,它的参数是线性的,你的大多数变量,但一些增长率,都会被转换。

在金融计量经济学中,由于日志返回的流行,日志是很常见的,因为...

对数转换有很好的特性

在对数回归模型中,它是估计参数的解释,比如说αi作为弹性_Y(t)Xi(t).

在纠错模型中,我们有一个经验上更强的假设,即比例比绝对差异更稳定平稳)。

在金融计量经济学中,很容易汇总随时间的对数回报

还有很多其他的原因这里没有提到。

最后

请注意,对数变换通常应用于非负(水平)变量。如果你观察到两个时间序列的差异(例如净出口),甚至无法取对数,你要么在层次上搜索原始数据,要么假设被减去的共同趋势的形式。

[编辑后添加]如果您仍然想要何时进行对数转换的统计标准,一个简单的解决方案将是任何异方差性测试。在方差增加的情况下,我会推荐 Goldfeld-Quandt 检验或类似的检验。在 R 中,它位于函数中library(lmtest)并用gqtest(y~1)函数表示。如果您没有任何回归模型,则简单地回归截距项y是您的因变量。

凭他们的果子,你们就知道他们

假设(待测试)是模型的误差具有恒定的方差。请注意,这并不意味着来自假设模型的错误。当您使用简单的图形分析时,您实际上是在假设一个线性模型。

因此,如果您的模型不充分,例如数据随时间随时间绘制的图,您可能会错误地得出需要进行幂变换的结论。Box 和 Jenkins 在他们的 Airline Data 示例中做到了这一点。他们没有考虑最新数据中的 3 个异常值,因此他们错误地得出结论,即在序列的最高水平上残差的变化更大。

有关此主题的更多信息,请参阅http://www.autobox.com/pdfs/vegas_ibf_09a.pdf

当序列以某种方式自然几何或投资的时间价值意味着您将与具有正回报的最小风险债券进行比较时,您可能想要对数转换序列。这将使它们更加“线性化”,因此适用于简单的差分递推关系。