预测精度滚动窗口

机器算法验证 时间序列 预测 准确性 样本外
2022-04-09 09:21:10

在执行样本外滚动窗口时,衡量 ARIMA 模型预测时间序列的最佳方法是什么?我不能使用 MPE,因为它包含零。我正在寻找的实际上是一个跨度,它指出:“预测的平均误差跨度在 ... % 和 ... % 之间。如何找到它?

3个回答

对称映射 (SMAPE) 将对您有用。追求 https://stats.stackexchange.com/search?q=SMAPE

@IrishStat 使用 SMAPE 的建议可能是最正确的。

log(x+1) 变换也可以工作。

了解您的应用程序会很有用。0的比例是多少?我很好奇您是否有间歇性时间序列。

间歇时间序列通常使用 Crostons 方法或泊松分布建模,基准预测是全零预测。如果您正在处理间歇性时间序列,那么通常使用分布误差度量。连续排名概率得分或弹球损失。

另一个可以处理零实际值的有趣措施:

相对总绝对误差:所有绝对误差的平均值除以绝对实际值的平均值。

该度量是 MAPE,其中总和被移动到分数中。一个优点是 RTAE 可以处理零实际值。

也就是说,当您的时间序列中有几个零时,SMAPE 和 RTAE 很有用。如果有很多零;接近 50% 或更多,那么这些措施对评估预测没有用处。在这种情况下,根据这些措施,最佳预测将为零。以下是具有大量零的时间序列时的错误度量参考:https ://www.lancaster.ac.uk/pg/waller/pdfs/Intermittent_Demand_Forecasting.pdf 。