我有一个相当可预测的每日时间序列,具有每周的季节性。当没有假期时,我能够提出看起来非常准确的预测(通过交叉验证确认)。但是,当有假期时,我有以下问题:
- 尽管所有历史假期都是 0,但我的预测中的假期数字非零。但这确实不是主要问题。问题是...
- 由于不在节假日发生的处理“溢出”到节假日之后的几天,一个简单的虚拟变量并不能减少它,因为这些异常值似乎是短期的创新。如果没有每周的季节性,我也许可以提出一个估计,用于在假期后的五天左右分发假期的未处理数据(如您如何创建反映假期的领先和滞后影响的变量中所建议的那样/时间序列分析中的日历效应?)。然而,“溢出”的分布取决于假期发生在一周中的哪一天,以及假期是圣诞节还是感恩节,订单的下单率低于一年中的其他时间。
以下是我的交叉验证中的一些快照,显示了一周中不同日子出现的假期的预测(蓝色)与实际(红色)结果:
我也担心圣诞节的影响取决于它所在的星期几,而我只有六年左右的历史数据。
有没有人对如何在预测的背景下处理这些类型的创新异常值有任何建议?(很遗憾我不能分享任何数据)