通常,在文学作品中,作者一直对寻找时间序列过程的平稳分布感兴趣。例如,考虑以下简单的 AR() 过程:
寻找任何随机过程的平稳分布的动机可能是什么?
使用得到的平稳分布可能会进行哪些其他(理论和实践)分析?
如果不存在平稳分布,问题是什么?这个过程会变得无用吗?
如果平稳分布存在但没有封闭形式怎么办?没有相同的封闭形式表达有什么缺点?
通常,在文学作品中,作者一直对寻找时间序列过程的平稳分布感兴趣。例如,考虑以下简单的 AR() 过程:
寻找任何随机过程的平稳分布的动机可能是什么?
使用得到的平稳分布可能会进行哪些其他(理论和实践)分析?
如果不存在平稳分布,问题是什么?这个过程会变得无用吗?
如果平稳分布存在但没有封闭形式怎么办?没有相同的封闭形式表达有什么缺点?
在这种情况下,对平稳分布感兴趣有多种动机,但可能最重要的方面是它们与限制分布密切相关。对于大多数时间序列过程,过程的平稳分布和极限分布之间存在密切联系。在非常广泛的条件下,基于 IID 误差项的时间序列过程具有平稳分布,并且它们收敛到该平稳分布,作为您指定的任何起始分布的限制分布。这意味着如果你让进程运行很长时间,无论它是如何开始的,它的分布都将接近于平稳分布。因此,如果您有理由相信该进程已经运行了很长时间,
在您的问题中,您使用 AR 的示例() 具有任意边际分布的 IID 误差项的时间序列过程。如果那么这个模型是一个循环的时间齐次马尔可夫链,它的平稳分布可以通过将其反转为一个 MA() 过程:
我们可以看到该过程是无限链 IID 误差项的加权和,其中权重呈指数衰减。可以从误差分布中获得极限分布通过对该加权和进行适当的卷积。一般来说,这将取决于形式它可能是一个复杂的分布。但是,值得注意的是,如果误差分布不是重尾的,并且如果因此衰减很慢,那么由于中心极限定理的近似,极限分布将接近正态分布。
实际应用:在AR的大多数应用中() 时间序列过程我们假设一个正态误差分布,这意味着过程的平稳分布是:
无论过程的起始分布如何,这个平稳分布都是过程的极限分布。如果我们有理由相信该过程已经运行了一段合理的时间,那么我们就知道该过程将收敛到接近该限制分布,因此假设该过程遵循该分布是有意义的。当然,与统计建模的任何应用一样,我们会查看诊断图/测试以查看数据是否伪造了我们假设的模型形式。然而,这种形式适用于 AR() 模型被使用。
如果不存在平稳分布怎么办:在某些时间序列过程中,平稳分布不存在。当系列有一些固定的周期性方面,或一些吸收状态(或其他非通信类状态)时,这是最常见的。在这种情况下,可能没有限制分布,或者限制分布可能是跨多个非通信类聚合的边际分布,这并不是那么有用。这本质上不是一个问题 - 它只是意味着您需要一种不同类型的模型来正确表示过程的非平稳性质。这更复杂,但统计理论有处理这个问题的方法和手段。