确定最佳相关时间序列

机器算法验证 时间序列 相关性
2022-03-22 16:07:41

在提问之前,我阅读了类似的问题,但没有一个能够为我的特定兴趣带来令人满意的答案。

我想均匀化多米尼加共和国 64 年(1940-2003 年)降水的气候时间序列。为此,在一组候选者中选择一个参考系列非常重要。

假设sjo是基础系列,我想为其找到一个好的参考系列;baniplc并且ra是参考候选,因为它们接近sjo在下图中,红点是基站,绿点是参考候选:

我进行了三个相关性分析(在 R 中完成,函数cor()),考虑到这些月变量:原始降水值、归一化差异和 Box-Cox 转换值。这些变量分别对应于以和开头的p字段dianpnorm

归一化差分来自于 Peterson 提出的一阶差分序列法(FDM),包括: [--1]/[+-1], 在哪里是该月的降水量, 和-1是一年前同月的降水量。我遵循了Peterson 及其同事 (1998) 的评论,该评论说将 FDM 应用于降水可能使用归一化差异效果更好。

从这个 PDF 文件的第 1 页可以看出,计算了整个时间序列(1940-2003 年)的相关性。对于原始降水和 Box-Cox 转换值,bani是最好的相关sjo(黄色背景单元格显示最大相关指数)。请注意,对于原始降水,bani其相关性明显高于其他降水。对于归一化差异,ra仅比其他差异更相关。然而,每个候选站都具有统计上显着的相关sjo指数α=.05显着性水平,表明其中任何一个都可以用作参考系列。

这有点令人困惑,所以我不满意并决定进行更详细的分析,将系列拆分为 5 年的时间间隔,并评估相同 3 个变量的系列之间的相关性:原始降水、归一化差异和 Box-Cox 转换.

PDF 中第 2 页到第 8 页的表格显示了这些偏相关的结果;最后一页总结了每个站点具有每个变量的最大相关值的时间。可以看出,bani是分析的 3 个变量的最常见相关值(在所有情况下,超过 7 次分析的 12 个 5 年期)。

有了这些结果,我认为这bani是作为参考系列的最佳候选者sjo,但我不确定。五年期分析可以吗?我应该进行其他分析吗?

1个回答

您如何尝试使用您的年度数据和/或 5 年周期间隔进行双向 Anova 和成对测试。您也可以使用原始的标准化数据或 Box-Cox 数据来执行此操作。

想法是,您可以查找每个站点的降水分布之间的任何非显着(对于参考站)差异。

我发现此链接有助于通过 R r-tutorial-series-two-way -anova 开始您自己的双向方差分析

塞巴斯蒂安