从具有明显季节性的历史时间序列估计事件概率

机器算法验证 时间序列 预测模型 季节性
2022-04-12 09:30:26

我想预测一年中满足两个条件的平均天数:

  • 日平均气温低于零摄氏度
  • 这一天之前至少有四天,日平均气温低于零摄氏度

我有该位置大约 10 年的历史日平均温度数据。我最初的方法是使用单边切比雪夫不等式 ,如果分布未知,它可以用来近似概率。但是在这个应用程序中,我对特殊条件的概率感兴趣,我也可以将 Chebyshev 不等式用于虚拟时间序列吗?即:如果条件满足,则为 1,否则为 0,--> 数据集因此看起来像 0,0,0,0,0,1,1,0,0,0,0,0,1,1,1 ,1,1,1 等

您将如何从不同的角度处理这样的问题,数据显然具有季节性,是否有任何分布可以用来进行比切比雪夫更好的估计?

2个回答

我认为连续几天的温度数据的联合分布可以使用多元高斯进行合理建模(高斯分布通常用于温度的统计缩减)。我会尝试将温度时间序列的均值和协方差矩阵回归到一年中的一天的正弦和余弦分量(以处理季节性)。Peter Williams在一篇论文中详细介绍了如何做到这一点,威廉姆斯使用神经网络,但我会从线性模型开始。这将为您提供气候学家所说的“天气发生器”(某种意义上的)。使用它,您可以使用适当的统计属性生成任意数量的合成时间序列,您可以从中直接估计所需的概率。您需要估计温度有效相关的窗口 - 由于阻塞模式(无论如何对于英国),冬季可能相当高。我想有点巴洛克风格,但这是我会尝试的!

我对气象知之甚少,所以我的以下假设可能是错误的:今天的温度与昨天和前天的温度相似(可能要追溯到更多天),并且也与一岁,两年前,三年前的温度相似,等等

如果这些假设得到加强,我将使用 ARMA 模型,使用天 -1、-2、……和 -365、-365*2、-365*3……作为今天温度的预测因子,也许几天后回顾移动平均条款。(您可以想象该模型的许多变体。)

在拟合模型后,我将进行大量基于模型的模拟,预测接下来 365 天的每一天的温度,并计算满足这两个条件的案例。