您如何看待新模型与更新模型(时间序列)?

机器算法验证 时间序列 有马
2022-04-09 13:45:51

我有一些问题向 [非统计学家] 人解释说,如果您使用新数据更新模型(添加新的实际值并将预测点向前移动),那么修改时间序列 (ARIMA) 模型的参数是很自然的。

我说:该模型根据系列中最近和较旧的值来预测系列的新值。如果我有新的数据点并希望从时间 t2 而不是点 t1 (t2 > t1) 进行预测,那么我必须使用 t1 和 t2 之间的数据更新模型,否则我实际上是从 t1 进行预测。这对于时间序列来说是很自然的。

他们说:您的模型系数已经改变了值,因此您开发了一个新模型。即使使用新数据,您也应该保持系数相同。

这次辩论的原因是我被指示不要建立一个新模型。在他们看来,我已经建立了一个新模型。在我看来,我没有。除了语义,我有三个主要问题:

(1) 我错了吗?我坦率地承认,该模型可能不再是“最佳”模型:它是最好的还是最合适的都不是问题。从根本上说,问题在于一个模型何时应该构成一个“新”模型。

(2) 有没有一种实用的、没有根本缺陷的方法来做他们要求的事情,即在不改变系数的情况下使用具有更新数据的时间序列模型?我能想到的唯一方法是:(a)仅从原始点进行预测,但在存在实际数据的情况下使用实际数据,以及(b)去掉 t1 和 t2 之间的时间,以便预测期从 t1 开始。(我应该指出,这在技术上是一个 ARIMAX 模型,因为我使用预测的宏观经济变量作为输入。)

(3)假设我没有错,是否有人有可能有助于向了解零统计的人解释时间序列的来源。

1个回答

你提出的问题非常重要。为了检验参数在一个或多个时间点没有显着变化的假设,我们实施了 CHOW 测试来测试参数的恒定性。如果我们检测到重大变化,那么我们就可以使用最新的数据集来开发一个新模型。该测试要求(至少对于我们知道时间序列的人来说)任何异常数据点都已通过干预检测程序进行了纠正/纠正(参见 R. Tsay 的工作)。如果你想继续这个话题,请随时与我联系,我会尽力帮助你。