异方差性和非平稳性之间的概念区别

机器算法验证 时间序列 异方差 平稳性 直觉
2022-03-09 01:41:33

我无法区分奇异性和平稳性的概念。据我了解,异方差是子群体的不同变异性,非平稳性是随时间变化的均值/方差。

如果这是一个正确的(尽管是简单化的)理解,那么非平稳性仅仅是跨时间异方差的一个特定情况吗?

3个回答

为了给出精确的定义,让X1,,Xn是实值随机变量。

平稳性通常仅在我们将变量的索引视为时间时才定义。在这种情况下,随机变量序列是平稳的X1,,Xn1具有相同的分布X2,,Xn. 这尤其意味着,Xi为了i=1,,n都具有相同的边际分布,因此具有相同的边际均值和方差(假设它们具有有限的二阶矩)。

异方差的含义可能取决于上下文。如果边际方差Xi的变化与i(即使平均值是恒定的)随机变量在不是同方差的意义上称为异方差。

在回归分析中,我们通常在回归量上条件性地考虑响应的方差,我们将异方差定义为非常数条件方差。

在时间序列分析中,术语条件异方差很常见,通常感兴趣的是Xk有条件地Xk1,,X1. 如果这个条件方差是非常量的,我们就有条件异方差。ARCH(自回归条件异方差)模型是具有非常量条件方差的平稳时间序列模型的最著名示例。

异方差(特别是条件异方差)并不意味着一般的非平稳性。

出于多种原因,平稳性很重要。一个简单的统计结果是平均

1ni=1nf(Xi)
然后是期望的无偏估计Ef(X1)(假设遍历性略高于平稳性并且通常隐含地假设,平均值是对预期的一致估计n)。

从统计的角度来看,异方差(或同方差)的重要性与统计不确定性的评估有关,例如置信区间的计算。如果计算是在同方差假设下进行的,而数据实际上显示异方差,则得到的置信区间可能会产生误导。

有3度的静止。弱形式要求均值和方差保持不变。这意味着 3 个平稳定义的要求比异方差性更强,因为异方差性意味着恒定方差,而不参考均值。

一个过程可以具有异方差性。但是如果它的平均值不是恒定的,那么这个过程就不是(弱)平稳的。

平稳过程(我们用“S”表示)意味着同方差性(我们用“H”表示)。所以 S --> H。

自然它的对立 也是如此所以H' --> S',即非同方差意味着非平稳。

但是倒置和否定是不正确的换句话说:

“非平稳意味着非同方差”是不正确的。

“存在一个非同方差的平稳过程”是不正确的。

如果时间序列的所有统计属性不依赖于时间原点,则时间序列是平稳的。如果不满足此要求,则时间序列不是平稳的。

即使是平稳的时间序列也不能仅基于一个样本记录来描述。必须通过对不同时间来源的样本记录集合进行平均来分析其统计特性。

如果任何单个样本记录的统计属性以及通过整体平均确定的情况相同,则时间序列是遍历的。

由于异方差时间序列的统计特性是时间相关的,因此它不是静止的,当然也不是遍历的。它为单个样本记录确定的属性不能扩展到其过去和未来的行为。

顺便说一句,相关/回归分析不能应用于时间序列,因为它们之间的依赖性(相干函数)是频率相关的,并且可以通过(多变量)随机差分方程方程(时域)或频率响应函数来表征(频域)。

将针对随机变量开发的回归分析扩展到时间序列是错误的(例如,参见 Bendat 和 Piersol,2010;Box 等,2015)。