确定时间序列中的趋势显着性

机器算法验证 时间序列 回归 相关性
2022-03-31 03:21:43

我有一些时间序列数据,想测试是否存在并估计因变量 wrt 时间中的线性趋势的参数,即时间是我的自变量。在无趋势为空的情况下,这些时间点不能被认为是 IID。具体来说,时间上彼此靠近的采样点的误差项是正相关的。出于所有实际目的,可以将在足够不同的时间获得的样本的误差项视为 IID。

我没有一个明确的模型来说明误差项如何与时间上彼此接近的点相关联。我从领域知识中所知道的只是它们在某种程度上呈正相关。除了这个问题,我相信通常最小二乘线性回归的假设(同方差、线性、正态分布误差项)得到满足。模相关误差项问题,OLS 将解决我的问题。

我是处理时间序列数据的新手。在这些情况下是否有任何“标准”方式进行?

4个回答

要添加到现有答案,如果您正在使用 R,则一种简单的继续方法是允许使用 ARMA 错误自动建模auto.arima()如果x是您的时间序列,那么您可以按如下方式进行。

t <- 1:length(x)
auto.arima(x,xreg=t,d=0)

这将适合模型,其中是使用 AIC 自动选择的。xt=a+bt+etetARMA(p,q)pq

结果输出将给出的值及其标准误差。这是一个例子:b

Series: x 
ARIMA(3,0,0) with non-zero mean 

Call: auto.arima(x = x, xreg = t) 

Coefficients:
          ar1     ar2      ar3  intercept       t
      -0.3770  0.1454  -0.2351   563.9654  0.0376
s.e.   0.1107  0.1190   0.1145    11.4725  0.2378

sigma^2 estimated as 5541:  log likelihood = -475.85
AIC = 963.7   AICc = 964.81   BIC = 978.21

在这种情况下,前三个系数给出自回归项,是截距,列中。在这个(人工)示例中,斜率与零没有显着差异。p=3q=0abt

auto.arima函数使用的是 MLE 而不是 GLS,但两者是渐近等价的。

仅当错误为 AR(1) 时才使用 Cochrane-Orcutt 程序。所以上面的内容更加通用和灵活。

广义最小二乘法 (GLS) 是这里的一种潜在选择。参数的 OLS 估计由下式给出:

β^=(XTΣ1X)1XTΣ1y

通常我们会省略,因为在 OLS 中它被定义为,即单位矩阵乘以估计的残差标准误差。是不相关误差的假设;一个观察与其自身完全相关,并且与任何其他观察不相关。Σσ2II

采取不同的形式来放松这种独立性假设。通常我们选择一个简单的过程来参数化,例如 AR(1)。在 AR(1) 中,时间两个误差之间的相关性为ΣΣts

cor(εsεt)={1ifs=tρ|ts|else

这将为我们提供以下误差协方差矩阵:

Σ=σ2(1ρρ2ρn1ρ1ρρn2ρ2ρ1ρn3ρn1ρn2ρn31)

需要额外的参数估计,ρ

可以使用更复杂的过程,包括 ARMA 模型。在 R 中,可以使用包nlme中的函数来拟合这些类型的模型Σgls()

如果您是 R 用户,您还可以查看允许与上述类似的东西的三明治包,但是您估计 OLS 模型,然后估计并将其用作插件值修正OLS参数的标准误。Σ

您所描述的通常称为自动相关错误我建议您查找有关 ARIMA 建模的资源。ARIMA 建模将允许您对误差项中的相关性进行建模,从而允许您独立于该自相关(或您感兴趣的其他自变量)来评估趋势变量。

对于 ARIMA 建模,我建议阅读 R McCleary的 Applied Time Series Analysis for the Social Sciences 1980;拉干草;EE梅丁格;D麦克道尔

但是有很多资源(时间序列分析是一个庞大的研究领域)。如果您无法访问学术图书馆,您可能只需通过 google 搜索就可以找到一些不错的在线资源。我刚刚打开了这个页面,Statistica ARIMA,它对 ARIMA 建模以及其他时间序列分析方法进行了简短但非常简洁的描述。

根据先前的答案,如果除了错误相关的事实之外,OLS 的所有假设都得到满足,那么像Cochrane-Orcutt校正这样简单的东西就足以解决您的问题。

其它你可能感兴趣的问题