随机时间序列组件的“系统”部分?

机器算法验证 时间序列
2022-04-07 02:26:31

我已经看到至少 3 个关于时间序列*的消息来源表明,一个被称为随机、随机或噪声的序列的组件(与任何确定性、图案化组件明显分开)本身由 2 个部分组成,一个系统部分和一个不系统的部分。我一生都无法弄清楚随机部分如何反过来具有系统部分。我可以看到该系列如何具有非系统性和系统性部分,但看不到该系列的随机部分如何同时具有这两者。

*例如,Burns 和 Grove,护理研究实践 (2005, p. 475-6)。

3个回答

您引用的 Burns 参考似乎将随机部分划分为自相关误差,这是任何时间序列分析的副产品(并且是系统的),而真正的随机误差是不可控的。

——拉尔夫·温特斯

“随机”通常被用作研究数据的真实属性,应将其替换为“不确定”。举个例子,如果我问你过去一个月赚了多少钱,你不告诉我,这不是“随机的”,而是不确定的。但是,将不确定性视为随机的,可以得出一些有用的结论。

噪声本身不是“随机的”,但考虑到我们通常对每个特定“噪声”是如何产生的了解有限,假设它是随机的可能是有用的。

现在,每当您将模型拟合到某些数据时,您都会得到该模型的残差。如果将“噪声”视为随机是一个好主意,那么模型的残差应该与您在拟合模型时使用的任何“随机性”定义一致。如果不是,那么基本上时间序列会告诉您,您假设的“随机性”并不能很好地描述实际发生的事情,它为您提供了一个线索,说明什么是更好的描述。

例如,如果我为系统部分拟合线性关系,但它实际上是二次的,那么所谓的“随机”噪声看起来根本不是随机的,而是包含系统部分的平方分量。

为了更具体,假设您的回答Y是一个确定性函数X, 说Y=3+2X+X2. 现在,因为你不知道这个函数,你假设Y=α+βX+error,并且由于您在查看数据之前没有理由怀疑模型,因此您假设错误只是“随机噪声”(通常N(0,σ2))。但是,一旦您实际拟合数据并查看残差,它们将全部排列为残差的精确二次函数。因此,“噪音”有一个系统成分(事实上,“噪音”是完全系统的)。这基本上是“自然”告诉“你”你的模型是错误的,并提供了如何改进它的线索。

同样的事情也在时间序列中发生。您可以将上面的模型替换为Y1=1,Y2=6,Y3=0.5,Y4=10,Y5=3,Y6=10并且对于t7Yt=10+2Yt15Yt13+2Yt5 同样的事情也会发生。

系统性和非系统性是相当模糊的术语。@probabilityislogic 给出了一种可能的解释。这里可能会给出另一个由于您给出的上下文是时间序列,我认为这可能与 Wold 定理有关。不幸的是,维基百科文本抓住了本质,但没有详细说明哪个部分是系统的和非系统的。

我没有找到合适的链接来参考,所以我会尝试根据我拥有的书给出一些解释。本书也讨论了这个主题我不会给出精确和严格的定义,因为它们涉及希尔伯特空间和其他研究生数学的东西,我认为这对于理解这一点并不是真正必要的。

每个协方差平稳过程{Xt,tZ}可以唯一地分解为两个平稳过程:Xt=Mt+Nt, 单数Mt并且经常Nt.

奇异和常规过程是通过它们的预测属性来定义的。静止过程理论中的过程预测Xt有时t由其历史的线性跨度形成(Xs,s<t). 奇异过程是预测误差为:

E(X^tXt)2

为零。这样的过程有时称为确定性的,在您的上下文中也可以称为系统性的。这种过程最简单的例子是Xt=η对所有人tη一些随机变量。然后线性预测Xt基于它的历史将永远是η. 如上定义的这种预测的误差为零。

另一方面,规则的平稳过程不能从它们的历史中没有错误地预测。可以证明平稳过程Nt是正规的当且仅当它承认 MA()分解。这意味着存在白噪声序列(εt)这样

Nt=t=0cnεtn.

其中系数cn是这样的,平等成立。这些过程有时被称为非确定性的,或者在您的情况下可能是非系统的。