PACF 分析输出与 LSTM 有什么关系?

数据挖掘 lstm 相关性 预测
2022-02-26 03:52:14

我正在阅读最近的一篇论文“A Novel Hybrid Data-Driven Model for Daily Land Surface Temperature ForecastingUsing Long Short-Term Memory Neural Network Ba​​sed on Ensemble Empirical ModeDecomposition” ,在这里找到。

提到的EEMD-LSTM方案确实是一个设计良好的模型,可以更准确地预测地表温度。我正在阅读并尝试使用类似的气候时间序列数据来实施给定的步骤(如出版物中所述)。我得到了不同的IMF和残差。

对于下一步,将所有 IMF 和残差馈送到 LSTM,如第 3.5 节(预测 IMF)中所述,论文提到要修复 LSTM 的输入,必须进行 PACF(部分自相关函数)分析超过 95% 置信区间 (CI) 的滞后数是 LSTM 的输入数。

我了解您正在获取分解结果的 PACF 顺序(例如:最大池站的 4,6,5,5,6,6,1,1,1,1,1,如出版物的图 7 所示其中 4 是原始数据系列的滞后数,6 是 IMF1 系列的滞后数,....,1 是 IMF9 系列的滞后数,1 是残差系列的滞后数)。

我的问题是:这个 PACF 顺序与 LSTM 的输入到底有什么关系(它是否确定要回顾的过去数据点的数量)?

如果有人可以对此提供一些解释,那就太好了。

谢谢。

1个回答

当用于时间序列时,LSTM(或任何神经网络方法)属于自回归模型的范畴。自回归模型的最一般公式是:

Yt=f(Yt1,Yt2,...,Ytn)其中 n 是要包含在模型中的过去滞后数。

当使用神经网络进行单变量时间序列建模时,n 将确定要使用的输入神经元的数量(可以是 n,也可以是 n+k,具有 k 个附加因果特征)。

PACF 将帮助您确定 n。

这里的关键是神经网络是 AR(p) 模型的泛化。