使用广义线性模型(例如自动相关性确定 (ARD) 和岭回归)与时间序列模型(例如 Box-Jenkins (ARIMA) 或指数平滑进行预测)有什么区别?是否有关于何时使用 GLM 以及何时使用时间序列的经验法则?
用于预测的广义线性模型与时序模型
不是真正的专家,但这个问题已经有一段时间没有答案了,所以我会尝试一个答案:我可以想到 GLM 和时间序列模型之间的 3 个区别 là Box 和 Jenkins:
1) GLM 将变量 Y 建模为其他变量 X (Y = f(X) ) 的函数。在时间序列模型中,您(主要是?)将变量 Y 建模为自身的函数,但来自先前的时间步( Y(t) = f(Y(t-1), Y(t-2),...) );
2)与上一点相关:GLM 本身不考虑输入协变量的自相关,而像 ARIMA 这样的时间序列模型本质上是自相关的;
3)我认为自回归模型基于残差是正态且均值为零的假设,而 GLM 接受更复杂的响应变量数据结构,可能具有非正态分布(伽玛、泊松等)。
何时使用 GLM 以及何时使用时间序列是否有任何规则?除非您将模型时间视为随机效应,否则我认为 GLM 只是模型时间序列的错误方法。
我本人长期研究神经行为,我必须说 GLM 在预测基于外部因素的复杂神经行为方面做得非常好,还可以预测其他神经元的活动或特定神经元的过去(即重构期、节奏调制等)。我还将它们用于广泛的代理建模、研究零通货膨胀、响应行为、噪声相关性等。
今天,我经常感到惊讶的是,人们通常甚至不知道 GLM 是什么,但每个人都知道 AR 模型。我仍然没有遇到很多我更喜欢 AR 模型的情况。
我认为有一个普遍的误解,即 GLM 不考虑时间相关性(即自相关或互相关),但事实并非如此。
我何时使用自回归模型的经验法则是:仅当我必须或问题的性质表明时!每当主要预测变量是预测数量本身的过去时,都应该考虑 AR 模型。它们基于过去和错误术语。例如,钟摆可以为 AR 模型提供自己。可以用微分方程描述的事物。即,如果没有携带有关未来信息的自变量。
如果我不需要,我总是更喜欢 GLM 模型而不是 AR 模型,因为在我看来,它们更清晰、更易于解释——至少对我来说是这样。但是,我认为最好的决定方法是 a) 真正理解你的问题 b) 尝试在纸上和数学上自己建模。最终,您可能会自然而然地得出一种或另一种模型。为了正确建模,两种变体都可能需要采用和修改。您对事物进行建模越复杂,对数据的两种描述就越接近。通常的问题是,您是否有适合您的方法的求解器。如果您过多地调整 GLM,它可能不再是凸问题,并且似然函数具有局部最大值。有时切换到 EM 算法或进化优化更有意义。
一般来说,我相信你越了解它,不同的术语就越令人困惑——尤其是当涉及到 GLM 的疯狂变化时。