我正在研究测量岩土数据的可变性。我看到文献中提到,应首先将非平稳数据转换为平稳数据(例如通过趋势去除),以便可以对去趋势的平稳数据进行进一步的统计分析。此外,提到大多数统计工具都假设数据是静止的,这就是为什么使非静止数据静止很重要的原因。我的问题是在哪里需要这种平稳性假设,即,如果我的数据是非平稳的并且我仍然使用统计分析,那么哪个结果会出错?例如,我正在查找数据的相关系数。如果我继续使用非平稳数据,我会得到错误的值吗?为什么?
“平稳性要求”为什么?
机器算法验证
时间序列
相关性
平稳性
2022-03-31 17:27:43
2个回答
首先,让我们确定您要询问的平稳性形式。有两种类型:
(1) 严格平稳性:时间序列行为的所有方面都不依赖于时间。即对于每个 m & n 的分布是相同的。
(2) 弱平稳性(有时称为协方差平稳性):如果不会因时间变化而改变。
- 严格平稳性和弱平稳性对于高斯过程是等价的,因为正态分布的前两个矩是唯一的特征。
假设我们在这里谈论的是弱平稳性,因为您似乎在询问相关性。
协方差公式:
=
所以协方差和相关性都是均值和方差的函数。
因此,例如,如果序列随着时间的推移持续增加,则样本均值和方差将随着样本的大小而增长,并且它们总是会低估未来时期的均值和方差。如果一个序列的均值和方差没有明确定义,那么它与其他变量的相关性也没有。出于这个原因,您还应该谨慎尝试推断适合非平稳数据的回归模型。
大多数统计预测方法都基于这样的假设,即通过使用数学变换可以使时间序列近似平稳(即“平稳化”)。平稳序列相对容易预测:您只需预测其未来的统计特性将与过去相同!
我从杜克大学的网站上窃取了这篇文章的最后两段。他们比我描述得更好。
http://people.duke.edu/~rnau/411diff.htm
有多种方法可以使时间序列平稳,包括去趋势和一阶差分。您可以在网站上找到许多关于两者的描述。上面的 Duke U 链接解释了第一个差分。可以使用去趋势模型进行预测和均值/方差,然后可以将模型转换回原始模型。
我是时间序列分析(TSA)的新手,但我的基本理解是 TSA 的主要目的是预测。时间序列由几个部分组成:趋势、季节性、周期性和不规则。通过转换或“平稳化”序列,可以轻松预测其统计特性(均值、方差),因为它们保持不变。趋势和季节性成分保持不变。然后分析主要集中在预测不规则分量上。如果我错了,请随时纠正我。
其它你可能感兴趣的问题