预测泊松、准确度和预测区间

机器算法验证 时间序列 预测 计数数据 预测区间 间歇时间序列
2022-04-07 14:36:22

我正在尝试根据组预测Poisson数据,分为1-26 months of data组。汇集的数据65% has a value of 025% a value of 1. 我找不到任何趋势或季节性,所以我开始测试几个不同的固定模型。Moving average (3), Moving Average (6),. Simple Exponential Smoothing_NaïveSimple Mean

我需要提前 1-6 个月预测并使用MADMSERMSE测试模型的准确性。看起来最准确的是 Simple Mean,带有 anRMSE of 1和 an MAD of 0,638我认为这真的很高,但我不知道该怎么做。

有没有我没想到的预测方法会更好?我在看什么吗?

关于预测区间,我唯一能找到的是F+ts作为预测,作为 t 分布,作为标准差。它认为它不是一个真正值得信赖的来源,但由于我找不到其他任何东西,我不确定如何设置这些预测间隔。这个方法对吗?F-tsFtalfa (n-2)s

我没有 R 可以使用。我需要自己做。

1个回答

您有所谓的间歇性需求,即以“许多”零为特征的需求时间序列。(如果您的时间序列本身不是需求,那么下面的大部分内容仍然适用。)因此,在网络上搜索“预测间歇性需求”已经很有帮助了。Teunter 和 Duncan (2009, JORS)概述了间歇性需求预测方法。

预测间歇性需求的标准方法是 Croston 方法。分别对需求间间隔和非零需求规模使用指数平滑那么点预测是平滑的非零需求与平滑的需求间间隔的比率。Syntetos 和 Boylan (2001, IJPE)注意到 Croston 有点偏颇并提出了修改,但这通常不会在实践中产生太大的影响。

另一种方法是整数自回归移动平均模型 (INARMA),它修改了标准 ARIMA 时间序列模型。Maryam Mohammadipour 就这些问题写了一篇论文

我个人对这种预期点预测的有用性有很大的怀疑。每隔一个时间段有 1 个需求的时间序列的期望值是 0.5 ......每四个时间段有 2 个需求的时间序列也是如此......等等 - 尽管这些是,当然,越来越少 Poisson-y . 我认为了解需求的整个未来(和预测性)分布更有用。所以我为你寻找预测区间鼓掌!

但是,您发现的公式仅适用于连续数据的单指数平滑,通过 ARIMA 模型 SES 是最佳的。所以不适合统计数据。我更愿意建议您采用点预测的泊松分布的分位数这仍然忽略了参数估计的不确定性(以及模型选择的不确定性等),但这是一种简单的可能性,并且可能比您拥有的公式更好。α(n2)y^λ=y^

Shenstone 和 Hyndman (2005, JoF)指出,没有一致的随机模型可以使 Croston 的方法是最优的 - 所有候选模型都是 (1) 连续的,而不是离散的,并且 (2) 可以产生负值。然而,对于那些候选模型,Shenstone 和 Hyndman 提供了预测区间。

最后,请注意:不要使用 MAD 来评估计数数据预测的准确性,尤其是对于间歇性需求。预期的 MAD 会被您未来分布的中位数(而不是其均值)最小化,如果您写出 65% 的数据为零,那么中位数为零......这意味着您可能会得到最低的 MAD零预测,这是严重的偏见,可能无用。这是我在去年的国际预测研讨会上就这个问题发表的演讲。或者看看Morlidge (2015, Foresight)

最后一段无耻的自我推销:我在 IJF(Kolassa,2016 年)上发表了一篇文章,该文章着眼于预测低容量数据(主要是间歇性的),采用不同的准确度度量和不同的预测方法,包括各种 Poisson 模型。这可能对您有用。