ARMA - 系数解释

机器算法验证 有马 解释 回归系数
2022-03-27 02:29:27

我想解释我的 ARMA 模型。我想尽可能多地讲述所有这些数字。我试图研究它,但仍有一些我不确定的问题。我将首先尝试解释我希望我理解正确的事情(如果没有,请帮助我),然后问你们如何解释其余部分。数据为银行同业拆借利率。

在此处输入图像描述

  • 首先是AIC和BIC。这应该告诉我模型有多好。我可以使用这些数字与用于这些数据的其他模型进行比较。例如,我可以尝试做 ARMA (5, 5) 看看这个不太复杂但更好的可解释模型是否更好。AIC 和 BIC 越低越好。我对么?

  • 常数系数只是试图描述我建模的数据的函数的常数。我对么?

  • ar.L1.PRIBOR_1m 这是模型的自回归。这意味着如果上一期的值改变了1,那么当前值改变了1,9136。我对么?

  • ar.L2.PRIBOR_1m 这意味着如果两个周期前的值改变1,那么当前值改变-1,4880。以此类推 ar.L3.PRIBOR_1m 等。我正确吗?

  • P>|z| 是系数显着性的 p 值。如果我决定对我来说足够 5 % 那么 P>|z| 的所有系数 是情人,那么 0,05 就可以了。我对么?

我不知道如何解释: -std err

  • 模型的移动平均部分。这些系数可以通过某种方式解释为自回归部分吗?

  • [95,0% Coef。诠释]是什么意思?

  • 我怎样才能把这个模型写成一个函数?像 Y=....

  • 表的第二部分(真实的、虚构的、...)值得描述吗?

非常感谢您的帮助。

2个回答

Graeme Walsh 在这里解释了如何更好地查看拟合而不仅仅是系数: ARIMA 模型解释


这里 David J Harris 描述了模型选择参数 AIC、BIC 等的差异。 AIC、BIC、CIC、DIC、EIC、FIC、GIC、HIC、IIC --- 我可以互换使用它们吗?


这里有一个关于 ARMA 模型的较早问题 如何在 python statsmodel 的 ARMA 模型中选择要估计的参数?


你的问题:*我想尽可能多地讲述所有这些数字。*

1)第一部分是描述性的(如简单的名称和选择的模型)+一些度量,如 AIC、BIC、HQIC,这些度量将可能性与参数和数据点的数量混合在一起。各种文本解释了它们与选择 ARMA 模型的关系。一个例子是:

从本课程http://halweb.uc3m.es/esp/Personal/personas/amalonso/esp/tsa.htm

第 9 课的第 50 页解释了 AIC 倾向于过度拟合,而 BIC 是一致的,因为它更多地惩罚 axtra 参数,但是 AIC 更好地模拟一个可能具有无限顺序的过程(我不确定这意味着什么,但想象一个顺序随样本量增长)

2)第二部分是模型参数的值加上它们的估计值。

标准误差涉及对预测值误差的估计(预测值与基础“真实”模型值的差异)。这是一个常客的概念。如果实验将(可能)进行多次(残差分布相同),误差将如何分布(简单地说:残差项对我的参数估计的影响有多强,比如说如果我用相似的误差项分布进行另一个测试,那么仅仅因为一组不同的剩余误差项,我可以找到多少不同的参数?)。该误差称为“标准误差”,因为用标准差或二阶矩的估计来表示误差的估计。这个错误可能是通过一些精确的公式或不太精确的公式计算出来的,

z这似乎是系数值的标准化值。它是只是另一种表达方式,而不是真正的新信息。在我看来是一个 t 检验。z=coef/std.errorP(|z|)

95% conf interval也没有新信息,似乎是系数值+/-某个标准误差的数值。百分比是指程序将在此间隔中包含正确值的概率/频率。

典型的统计解释适用于这三个概念。但请注意 Graeme Walsh 在链接参考中的评论,即单独查看所有这些参数并不是很好。

3)第三部分,复数,与模型特征方程的根有关。

例如,这里对此进行了解释: https ://en.wikipedia.org/wiki/Autoregressive%E2%80%93moving-average_model#Specification_in_terms_of_lag_operator

使用特征方程可以表达几个理论结果。另请参阅 Graeme Walsh ARIMA 模型解释的答案

例如,在您的情况下,您会看到模数始终 >1,因此该过程是静止的。

您可以使用 pi 权重来帮助您解释/破译/解释模型。pi 权重是通过将 ma 多项式除以 ar 多项式获得的。以这种方式呈现(即作为纯 ar),模型的参数只是过去的加权平均值。再见了您的模型在我的经验中的方式,我的意思是“方式”由于模型不佳而过度参数化,即基于列表的选择策略而不是迭代自检多阶段方法。需要通过结合脉冲指标来处理异常值,而不是折磨 ar 和 ma 系数来解释异常。通常,您还可以有一个非常量的误差方差,可以通过 GLS 或合适的幂变换来处理。最后可能会有模型参数变化的时间断点。