如何解释时间序列?

机器算法验证 r 时间序列 多元分析
2022-03-09 01:49:32

到目前为止,我主要使用横截面数据和最近浏览,浏览了一堆介绍性的时间序列文献,我想知道解释变量在时间序列分析中扮演什么角色。

我想解释一种趋势而不是去趋势。我作为介绍读到的大部分内容都假设该系列源于一些随机过程。我阅读了有关 AR(p) 和 MA 过程以及 ARIMA 建模的信息。想要处理比自回归过程更多的信息,我找到了 VAR / VECM 并运行了一些示例,但我仍然想知道是否存在一些与解释在横截面中所做的更接近的案例。

这背后的动机是我的系列分解表明趋势是主要贡献者,而剩余和季节性影响几乎没有作用。我想解释一下这种趋势。

我可以/应该在多个不同的系列上回归我的系列吗?直觉上,由于序列相关性,我会使用 gls (我不太确定 cor 结构)。我听说过虚假回归并理解这是一个陷阱,但我正在寻找一种解释趋势的方法。

这是完全错误的还是不常见的?还是我到目前为止错过了正确的章节?

4个回答

根据您对回复提供的评论,您需要注意虚假的因果关系任何具有时间趋势的变量都将与另一个也具有时间趋势的变量相关。例如,我从出生到 27 岁的体重将与您从出生到 27 岁的体重高度相关。显然,我的体重不是由您的体重引起的。如果是的话,我会要求你更频繁地去健身房,拜托。

由于您熟悉横截面数据,我将给您一个省略的变量解释。设我的体重为,你的体重为,其中 xtyt

xt=α0+α1t+ϵt andyt=β0+β1t+ηt.

那么回归 有一个遗漏变量——时间趋势——与包含变量相关。因此,系数将是有偏差的(在这种情况下,它将是正的,因为我们的权重会随着时间的推移而增长)。

yt=γ0+γ1xt+νt
xtγ1

当您执行时间序列分析时,您需要确保您的变量是平稳的,否则您会得到这些虚假的因果关系结果。集成系列是一个例外,但我建议您参考时间序列文本以了解更多信息。

与横截面回归相同的直觉可以用于时间序列回归。尝试使用其他变量来解释趋势是完全有效的。主要区别在于隐含地假设回归变量是随机变量。所以在回归模型中:

Yt=β0+Xt1β1+...+Xtkβk+εt

我们需要而不是而不是E(εt|Xt1,...,Xtk)=0Eεt=0E(εt2|Xt1,...,Xtk)=σ2Eεt2=σ2

回归的实际部分保持不变,所有常用的统计数据和方法都适用。

困难的部分是显示哪些类型的随机变量,或者在这种情况下随机过程我们可以使用经典方法。不能应用通常的中心极限定理,因为它涉及独立的随机变量。时间序列过程通常不是独立的。这就是平稳性的重要性发挥作用的地方。结果表明,对于大部分平稳过程,可以应用中心极限定理,因此可以应用经典回归分析。Xtk

时间序列回归的主要警告是,当回归量不平稳时,它可能会大量失败。然后,通常的回归方法可以表明趋势得到了解释,而实际上并非如此。所以如果你想解释趋势,你必须在继续之前检查非平稳性。否则你可能会得出错误的结论。

当你有支持/因果/帮助/右手边/外生/预测系列时,首选的方法是构造一个方程,多输入传递函数。需要检查未指定/省略的确定性输入的可能模型残差,即通过 ARIMA 组件进行干预检测 ala Ruey Tsay 1988 Journal of Forecasting 和未指定的随机输入。因此,您不仅可以明确包括用户建议的因果关系(以及任何需要的滞后!),还可以包括两种省略的结构(哑元和 ARIMA)。

应注意确保最终模型的参数不会随时间显着变化,否则数据分割可能是有序的,并且最终模型的残差不能被证明具有异质方差。

原始序列中的趋势可能是由于预测序列中的趋势或由于感兴趣序列中的自回归动态,或者可能是由于由稳态常数或什至一个或多个本地时间趋势代理的省略确定性序列。

作为一个技术含量较低的观点,通常仅仅解释趋势并不是很有帮助;也就是说,将时间视为主要兴趣的预测因素。序列随时间的变化通常意味着其他变量的潜在影响,包括自回归和/或外生过程,这在概念上与研究更相关。因此,如果这些变量也随着时间而变化,那么实际上需要控制时间效应,而不是像@mpiktas 所示的那样落入人为的显着关系中。