ARIMA 误差模型回归的正确性和系数解释问题

机器算法验证 r 时间序列 预测 有马 回归系数
2022-04-05 17:44:47

我正在尝试使用 R(预测包)预测未来 2 年(从 2013 年 6 月开始)的 GWh 用电量。为此,我尝试使用 ARIMA 错误进行回归。我使用函数拟合了模型,并在函数的参数中auto.arima使用了以下变量xregforecast.Arima

- 加热和冷却度日,
- 所有 12 个月的
假人 - 移动假期假人(复活节和斋月)

我对模型有几个问题:

1)将所有 12 个虚拟变量用于每月季节性是否正确,因为当我尝试包含 11 个时,函数返回错误。函数返回模型 ARIMA ( Auto.arima0,1,2)

2)模型返回以下系数(系数太多,我不会全部指定):

ma1      ma2     HDD     CDD   January  February  March     April
-0.52 -0.16      0.27    0.12  525.84   475.13    472.57    399.01

我试图确定温度分量对电力负荷的影响。以百分比表示,(解释系数与通常的回归一样)温度分量 ( HDD+ CDD) 占电力消耗的 11.3%。考虑到电力消耗主要受天气因素的影响,这不是太少了吗?另一方面,看看假人的系数,结果表明季节性占负载的大部分。为什么是这样?模型完全不正确吗?

我尝试了线性回归,温度分量占了20%,但仍然是一个很低的百分比。为什么是这样?

3)我显然在使用forecast.Arima或绘图函数参数时犯了一些错误,因为当我绘制预测时,我得到一张原始时间序列的图片,该图片与整个时间序列期间的预测(从2004 年至 2015 年)。我不知道如何更好地解释这一点,我试图粘贴图片,但似乎我无法在这里粘贴图片。

1个回答
  1. 在任何回归模型中,包括带有 ARMA 错误的回归,您必须指定比类别数少一个虚拟变量。直观地说,这是因为如果您知道 11 个每月虚拟变量的值,那么您就知道第 12 个的值。所以它没有提供新的信息。

  2. 这里有两个问题。首先,季节性与天气混为一谈,因此您无法区分它们的影响。其次,不可能从每个预测变量中分配百分比贡献,除非预测变量都是正交的。

  3. 预测对象的绘图方法显示历史数据和预测以及预测区间。查看帮助文件以了解如何根据自己的目的修改绘图。