AIC / BIC 的 AR 模型参数的正确数量?

机器算法验证 aic 比克
2022-03-18 13:42:30

我有一个时间序列,想使用 AIC / BIC 来决定以下哪个模型最合适:

  • A) AR(1),无高斯创新项常数
  • B) AR(2),无高斯创新项常数
  • C) AR(1),与 Student t 创新项无常数
  • D) AR(2),与 Student t 创新项无常数

对于上述模型,在 AIC / BIC 中使用的正确参数数量是多少?

我在Matlab 文档中找到了对具有高斯分布的 ARMA(p,q) 模型的以下解释:“计算每个拟合模型的 BIC。模型中的参数数量为 p + q + 1(对于 AR 和 MA系数和常数项)。”

我不明白的是为什么没有为同样估计的高斯分布的方差添加参数。特别是如果创新项是学生 t 分布,我假设学生 t 分布的附加“自由度”参数需要在 AIC / BIC 中考虑?

我直观地会选择多个参数,A 为 2,B 为 3,C 为 3,D 为 4,但如果方差为不计为参数(如在 Matlab 示例中)。

2个回答

对于 AIC/BIC 选择,您是否选择计算方差参数并不重要,只要您在模型之间保持一致即可,因为基于信息论标准的推理仅取决于不同模型的值之间的差异。因此,全面添加 2(用于附加参数)不会改变任何 delta-*IC 值,这是您用于选择模型(或进行模型平均、计算模型权重等)的全部内容.

(但是,如果您要比较装有不同程序或不同软件包的模型,则必须小心,因为它们可能以不同的方式计算参数。)

如果您要使用AICc或其他一些有限大小校正标准,这很重要,因为这样会使用数据集中的残差信息(校正项的分母是nk1)。那么你要问的问题是是否应该包括一个讨厌的参数,比如残差方差,它可以在不修改估计过程的情况下从残差中计算出来。我在这篇 r-sig-mixed-models 帖子中写道,我不确定这里的正确程序。然而,快速查看 Hurvich 和 Tsai 的原始论文(Hurvich, Clifford M., and Chih-Ling Tsai. 1989. “Regression and Time Series Model Selection in Small Samples.” Biometrika 76 (2) (June 1): 297–307 , doi:10.1093/biomet/76.2.297, http://biomet.oxfordjournals.org/content/76/2/297.abstract ),看起来它们确实包含方差参数,即它们使用k=m+1对于线性模型m线性系数...

我会进一步引用 Press等人。(C 中的数字食谱):

我们还可以评论说,如果NN1 对你来说很重要,那么你可能无论如何都做不好 - 例如试图用边际数据证实一个有问题的假设。

(他们正在讨论样本方差计算中的偏差校正项,但原理也适用于此。)

要获得ARMA模型中的AIC或BIC准则,如果按照“时间序列分析与示例预测中所述进行估计,则需要找到包括常数项在内的模型中估计参数的个数(残差除外),Søren Bisgaard,Murat Kulahci,第 164 页。因此,ARMA(p,q) 中包含截距或常数项的估计参数数量为p+q+1p+q当你没有拦截时。例如,参见Jonathan D. Cryer、Kung-Sik Chan的“时间序列分析:R 中的应用”中的第 6.5 节。