结合线性回归和时间序列

机器算法验证 时间序列 多重回归
2022-04-02 13:34:47

我试图弄清楚我是否可以结合线性回归和时间序列模型来帮助预测足球比赛中的射门次数。

当我执行线性回归时,我有一些非常重要的自变量(例如家庭/在路上,财产),然后我留下了一些似乎显示出显着自相关的残差(特别是当我测试时为PACF)。

我无法理解的是,我如何以及是否可以结合这两种技术来帮助我进行预测。

以前我在想我会弄清楚我应该使用什么滞后/ARIMA 模型(它看起来像 (2,0,0)),然后将 AR2 应用于残差(甚至整个因变量)以产生然后我在线性回归中使用一个新的自变量。但这在数学上似乎并不合理。

那么,我应该怎么做呢?例如,如果我知道下一位球员的比赛在主场,他的球队预计将获得 60% 的控球率,并且(上述重要变量的)回归的残差显示出显着的 AR2 相关性,我应该如何适当地利用这一点信息来产生他的投篮的最佳预测?

2个回答

以前我在想我会弄清楚我应该使用什么滞后/ARIMA 模型(它看起来像 (2,0,0)),然后将 AR2 应用于残差(甚至整个因变量)以产生然后我在线性回归中使用一个新的自变量。但这在数学上似乎并不合理。

您可以同时进行,而不是分两步进行,使其更加“数学合理”。这将是一个带有 ARMA 错误的回归。以下是对此和相关技术的一些讨论。还讨论了 R 实现。

在您的情况下,表示因变量和自变量加载库“预测”后,用于在模型错误中自动选择 ARMA 结构的合理顺序。yx1,,xkauto.arima(y,xreg=cbind(x_1,...,x_k))

这种组合称为传递函数建模。有关我的答案,请参阅受自自相关影响的交叉相关以及宾夕法尼亚州立大学关于模型识别的非常好的教程。还请查看http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting/doc_download/24-regression-vs-box-jenkins对回归与 Box-Jenkins 的哲学讨论