机器算法验证 - 在时间序列模型中使用 R 平方有什么问题？ - 吾爱随笔录

在时间序列模型中使用 R 平方有什么问题？

机器算法验证回归时间序列 r平方

2022-02-09 16:37:34

我已经读过将 R-squared 用于时间序列是不合适的，因为在时间序列上下文中（我知道还有其他上下文）R-squared 不再是唯一的。为什么是这样？我试图查找这个，但我没有找到任何东西。通常，当我评估我的模型时，我不会太看重 R-squared（或调整后的 R-Squared），但我的很多同事（即商业专业）绝对爱上了 R-Squared，我希望能够向他们解释为什么 R-Squared 在时间序列的上下文中不合适。

2个回答

问题的一些方面：

如果有人给我们一个数字向量 $\mathbf y$ 和一个一致的数字矩阵 $\mathbf X$ ，我们不需要知道它们之间的关系来执行一些估计代数，处理 $y$ 作为因变量。无论这些数字是否代表横截面或时间序列或面板数据，或者矩阵是否 $\mathbf X$ 包含滞后值 $y$ 等等

决定系数的基本定义 $R^2$ 是

R^{2} = 1 - \frac{S S_{r e s}}{S S_{t o t}}

$R^2 = 1 - \frac {SS_{res}}{SS_{tot}}$

在哪里 $SS_{res}$ 是来自某个估计过程的残差平方和，并且 $SS_{tot}$ 是因变量与其样本均值的平方偏差之和。

结合起来， $R^2$ 对于特定的数据样本，变量之间关系的特定公式和特定的估计程序将始终是唯一计算的，仅受制于估计程序能够提供所涉及的未知量的点估计的条件（因此对因变量进行点估计，从而对残差进行点估计）。如果这三个方面中的任何一个发生变化，则 $R^2$ 通常会发生变化-但这适用于任何类型的数据，而不仅仅是时间序列。

所以问题是 $R^2$ 和时间序列，不是它是否“唯一”（因为大多数时间序列数据的估计程序都提供点估计）。问题是“通常的”时间序列规范框架在技术上是否对 $R^2$ ，以及是否 $R^2$ 提供了一些有用的信息。

的解释 $R^2$ 因为“解释的因变量方差的比例”主要取决于残差加起来为零。在线性回归（在任何类型的数据上）和普通最小二乘估计的上下文中，只有当规范在回归矩阵中包含常数项（时间序列术语中的“漂移”）时，才能保证这一点。在自回归时间序列模型中，在许多情况下不包括漂移。

更一般地说，当我们面对时间序列数据时，我们会“自动”开始思考时间序列将如何演变到未来。因此，我们倾向于更多地根据它对未来值的预测程度来评估时间序列模型，而不是它与过去值的拟合程度。但是 $R^2$ 主要体现的是后者，而不是前者。众所周知的事实是 $R^2$ 回归量的数量不减少意味着我们可以通过不断添加回归量来获得完美的拟合（任何回归量，即任何数字序列，可能在概念上与因变量完全无关）。经验表明，如此获得的完美拟合也会在样本之外给出糟糕的预测。

直觉上，发生这种可能违反直觉的权衡是因为通过将因变量的整个可变性捕获到估计方程中，我们将非系统可变性转变为系统可变性，就预测而言（这里，“非系统性”应该相对于我们的知识来理解——从纯粹决定论的哲学观点来看，不存在“非系统的可变性”这种东西。但是在我们有限的知识迫使我们将某些可变性视为“非系统的”的程度上，那么试图将其转变为系统的组件，带来预测灾难）。

事实上，这也许是向某人展示原因的最有说服力的方式 $R^2$ 处理时间序列时不应该是主要的诊断/评估工具：将回归变量的数量增加到一个点 $R^2\approx 1$ . 然后取估计方程并尝试预测因变量的未来值。

对上述帖子的一些额外评论。在处理时间序列时，如果解释变量没有差异，R 平方（或调整后的 R^2）总是会更大。然而，当它进入超时拟合时，非差分时间序列的误差项会显着更高。这是因为数据中呈现的趋势和众所周知的问题。但这是一个很好的方式来说明为什么在选择最合适的时间序列模型时，这个度量应该排在最后。

其它你可能感兴趣的问题

上一篇为什么 PCA（协方差矩阵的特征向量）中的主成分相互正交？下一篇统计历史时期