至少在一些更高水平的统计学家中,AIC 统计量值在最小值的某个阈值内的模型应该被认为是最小化 AIC 统计量的模型是合适的。例如,在 [1, p.221] 我们发现
那么具有小 GCV 或 AIC 的模型将被认为是最好的。当然,不应该只是盲目地最小化 GCV 或 AIC。相反,所有具有相当小的 GCV 或 AIC 值的模型都应被视为可能合适,并根据其简单性和科学相关性进行评估。
同样,在 [2, p.144] 我们有
有人建议 (Duong, 1984) AIC 值在最小值 c 内的模型应该被认为是有竞争力的(c=2 作为典型值)。然后可以根据残差的白度(第 5.3 节)和模型简单性等因素从竞争模型中进行选择。
参考:
- 鲁珀特,D。Wand,MP & Carrol,RJ半参数回归,剑桥大学出版社,2003
- Brockwell, PJ & Davis, RA时间序列和预测简介,John Wiley & Sons,1996
那么鉴于上述情况,应该首选以下两种模型中的哪一种?
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
更一般地说,什么时候适合通过盲目地最小化 AIC 或相关统计量来选择模型?