您有所谓的间歇性需求,即以“许多”零为特征的需求时间序列。(如果您的时间序列本身不是需求,那么下面的大部分内容仍然适用。)因此,在网络上搜索“预测间歇性需求”已经很有帮助了。Teunter 和 Duncan (2009, JORS)概述了间歇性需求预测方法。
预测间歇性需求的标准方法是 Croston 方法。分别对需求间间隔和非零需求规模使用指数平滑。那么点预测是平滑的非零需求与平滑的需求间间隔的比率。Syntetos 和 Boylan (2001, IJPE)注意到 Croston 有点偏颇并提出了修改,但这通常不会在实践中产生太大的影响。
另一种方法是整数自回归移动平均模型 (INARMA),它修改了标准 ARIMA 时间序列模型。Maryam Mohammadipour 就这些问题写了一篇论文。
我个人对这种预期点预测的有用性有很大的怀疑。每隔一个时间段有 1 个需求的时间序列的期望值是 0.5 ......每四个时间段有 2 个需求的时间序列也是如此......等等 - 尽管这些是,当然,越来越少 Poisson-y . 我认为了解需求的整个未来(和预测性)分布更有用。所以我为你寻找预测区间鼓掌!
但是,您发现的公式仅适用于连续数据的单指数平滑,通过 ARIMA 模型 SES 是最佳的。所以不适合统计数据。我更愿意建议您采用点预测的泊松分布的分位数。这仍然忽略了参数估计的不确定性(以及模型选择的不确定性等),但这是一种简单的可能性,并且可能比您拥有的公式更好。α(n−2)y^λ=y^
Shenstone 和 Hyndman (2005, JoF)指出,没有一致的随机模型可以使 Croston 的方法是最优的 - 所有候选模型都是 (1) 连续的,而不是离散的,并且 (2) 可以产生负值。然而,对于那些候选模型,Shenstone 和 Hyndman 提供了预测区间。
最后,请注意:不要使用 MAD 来评估计数数据预测的准确性,尤其是对于间歇性需求。预期的 MAD 会被您未来分布的中位数(而不是其均值)最小化,如果您写出 65% 的数据为零,那么中位数为零......这意味着您可能会得到最低的 MAD零预测,这是严重的偏见,可能无用。这是我在去年的国际预测研讨会上就这个问题发表的演讲。或者看看Morlidge (2015, Foresight)。
最后一段无耻的自我推销:我在 IJF(Kolassa,2016 年)上发表了一篇文章,该文章着眼于预测低容量数据(主要是间歇性的),采用不同的准确度度量和不同的预测方法,包括各种 Poisson 模型。这可能对您有用。