目前我正在做一个项目来预测时间序列数据(月度数据)。我正在使用 R 进行预测。我有 1 个因变量 (y) 和 3 个自变量 (x1, x2, x3)。y 变量有 73 个观测值,其他 3 个变量也是如此(也有 73 个)。从 2009 年 1 月到 2015 年 1 月。我检查了相关性和 p 值,将其放入模型中都很重要。我的问题是:如何使用所有自变量做出好的预测?我没有这些变量的未来值。假设我想预测两年内(2017 年)我的 y 变量。我怎样才能做到这一点?
我尝试了以下代码:
model = arima(y, order(0,2,0), xreg = externaldata)
我可以使用此代码预测 2 年内的 y 值吗?
我还尝试了回归代码:
reg = lm(y ~ x1 + x2 + x3)
但是我如何在这段代码中花时间呢?我如何预测我的 y 值将超过 2 年?我是统计和预测的新手。我已经对滞后值进行了一些阅读和分析,但是如何在模型中使用滞后值进行预测?
实际上,我的总体问题是如何预测具有没有未来值的外部变量的时间序列数据?