- 我想知道为什么从通用到特定 (GETS) 子集选择,尤其是Autometrics算法在宏观经济建模/预测中表现良好。
Autometrics是如何工作的?
- Doornik "Autometrics" (2009) 提供了完整的描述(算法方案请参见第 7-8 页)。
该算法基于具有资格的逐步子集选择,并包括诊断测试。
下面列出了几个主要功能。 - 一般模型被表述为具有
(i) 主要变量、
(ii) 其大量滞后以及在后续版本中
(iii) 脉冲(用于脉冲指示饱和 (IIS) 或阶跃指示饱和 (SIS) 技术的线性模型)考虑可能的结构断裂)和
(iv)非线性变换。 - 该算法从一般模型开始逐步选择,并沿着多条路径进行。
- 变量不仅可以被删除,而且可以在每个步骤中添加(除了包含所有变量的初始步骤)。
- 显着性检验用于变量去除/包含。
- 当搜索终止时(基于变量的重要性),进行诊断测试。不良模型不再考虑。
Autometrics 的表现如何?
- 从David F. Hendry 爵士、Jurgen A. Doornik等人的作品中可以看出Autometrics的良好性能。(在链接中,请参阅有关模型选择、Autometrics和相关的作品)。
当然,独立作者的经验会比Autometrics的“父亲”的经验更可信。
- Kock & Teräsvirta “2007-2009 年经济危机期间三种自动化建模技术的预测性能”(2014 年)发现:
[ Autometrics ] 当模型与现实有合理的近似时效果很好,但在不是时效果较差。在直接预测中,人们面临的是后一种情况……看来,Autometrics可能不是构建直接多期预测模型的合适工具。但是,当研究人员数据集中的变量子集很好地近似数据生成过程时,它可能是一个很好的选择。
Epprecht 等人。“比较线性回归的变量选择技术:LASSO 和 Autometrics”(2013 年)发现 Autometrics 和 LASSO 在不同方面和不同设置中的表现优于对方。
Hendry 自己的Autometrics性能测试中的典型设置是正确模型是一般模型的子集。显示Autometrics以选择一个模型,该模型要么是真实的,要么非常接近它。
同时,在一般模型的锥形效应或相当大的错误规格下, Autometrics的表现可能不太好,例如上面的 Kock & Teräsvirta (2014)。
为什么好的表现令人惊讶?
- 由于没有收缩并且必须在大量变量中进行选择(这是 Hendry 和 Doornik 的许多作品中的设置),我预计 GETS 会失败。(例如,弗兰克·哈雷尔(Frank Harrell)在几个帖子中谴责了子集选择,例如1和2,尽管这些帖子并非特定于宏观经济时间序列。)
- (问题) GETS 和Autometrics的良好性能是否可以特定于应用程序(主要是宏观经济时间序列建模),
或者Autometrics只是广义上的一种非常好的方法?
“LASSO/LARS vs 一般到特定(GETS)方法”是一个相关问题。