数据挖掘 - PACF 分析输出与 LSTM 有什么关系？ - 吾爱随笔录

我正在阅读最近的一篇论文“A Novel Hybrid Data-Driven Model for Daily Land Surface Temperature ForecastingUsing Long Short-Term Memory Neural Network Based on Ensemble Empirical ModeDecomposition” ，在这里找到。

提到的EEMD-LSTM方案确实是一个设计良好的模型，可以更准确地预测地表温度。我正在阅读并尝试使用类似的气候时间序列数据来实施给定的步骤（如出版物中所述）。我得到了不同的IMF和残差。

对于下一步，将所有 IMF 和残差馈送到 LSTM，如第 3.5 节（预测 IMF）中所述，论文提到要修复 LSTM 的输入，必须进行 PACF（部分自相关函数）分析超过 95% 置信区间 (CI) 的滞后数是 LSTM 的输入数。

我了解您正在获取分解结果的 PACF 顺序（例如：最大池站的 4,6,5,5,6,6,1,1,1,1,1，如出版物的图 7 所示其中 4 是原始数据系列的滞后数，6 是 IMF1 系列的滞后数，....，1 是 IMF9 系列的滞后数，1 是残差系列的滞后数）。

我的问题是：这个 PACF 顺序与 LSTM 的输入到底有什么关系（它是否确定要回顾的过去数据点的数量）？

如果有人可以对此提供一些解释，那就太好了。

谢谢。