当当天的数据不完整时,如何预测未来的预订?

机器算法验证 预测
2022-03-17 16:51:47

我正在尝试建立一个模型来预测最多提前 15 天的预订。

所以,如果我想预测明天会有多少预订,我使用前两天有多少总预订的历史数据,因为当使用模型预测明天时,今天不会完成......有道理?

我认为这是一个不错且无偏见的模型,但是,它并没有使用所有可用的数据,即今天已经为明天进行了多少预订。所以,如果我希望我的模型更“实时”并且还考虑当前的预订,我该怎么做?我是否会查看一天中的预订数据,然后只设置一个比例或其他什么?例如,如果我在 13:00 使用我的模型,发现我有 20 个额外的预订,并且我知道历史上 40% 的额外预订是在 13:00 之前进行的,我是否只取 20+ 20*(60/40 ) = 50。所以现在我应该在昨天的总数告诉我的基础上再“期待”50 个?这就是我能想到的。

编辑:

“例如,如果在一场棒球比赛中完成三局比赛需要 1 小时,您可以放心,接下来的 6 局比赛将需要比 2 小时更长的时间才能完成。” 那么,如果你知道历史上前 3 局占了 25% 的时间呢?坚持球赛的例子,这很好地说明了我的问题,我认为你理解戴夫,但我不确定我是否已经为其他人说清楚了......

如果你想预测一场球赛的持续时间,你可能有一些基于当前球队、投手等的公式。但是,考虑一场比赛,你预测一场 2.5 小时的比赛,你在第 4 局, 已经用了 3 个小时了,现在怎么办?

戴夫,我尝试了不同的技术,包括季节性 arima 方法等。我不熟悉“水平转换”,尽管我已经看到你在许多帖子中提到它们。我会做一些进一步的网上冲浪来理解这个概念。我会对聊天会话非常感兴趣。请让我知道你什么时候有空,我是东部标准时间 +11 小时。

1个回答

比率估计不起作用。例如,如果在一场棒球比赛中完成三局比赛需要 1 小时,您可以放心,接下来的 6 局比赛将需要比 2 小时更长的时间才能完成。为了预测明天,给定今天的部分信息和全部信息在过去的 NOB 日子里,我建议我们为宝洁公司实施的以下方法,因为他们无法及时发现经济衰退。他们的问题是,如果我们在当前月份的历史中有 15 天,还有 16 天,比如 1 个假期和 2 个星期六(例如),我们想要计算实现总销售额 X 的概率。我们实施了一个每日预测模型,其中包括星期几;一年中的星期; 一年中的月份效应以及已知事件周围的领先/同期和滞后效应以及任何被证明具有统计学意义的水平变化/时间趋势。该模型/方法还包括 ARIMA 组件和验证测试/补救措施,以确保参数的稳定性和随时间的变化。此外,为了开发强大的数据生成函数 (DGF),还考虑了脉冲和季节性脉冲(即星期几的显着变化)。您想要做的是还包括一个小时预测模型,该模型将与每日预测/模型一起产生对当天总数和未来 15 天总数的估计。

如果您希望发布至少 2-3 年的每小时数据,我很乐意与列表分享结果。如果由于某种原因您不想与列表共享您的数据,那么也许我们可以进行聊天室会话。

我们还与一家大型连锁酒店有过一些经验,以改善他们对入住率的 60 天预测。