如何在每日时间序列数据中模拟月度效应?

机器算法验证 r 时间序列 季节性 向量自回归
2022-03-13 04:20:03

我有两个时间序列的每日数据。一个是订阅sign-ups,另一个terminations是订阅。我想使用两个变量中包含的信息来预测后者。

查看这些系列的图表,很明显终止与前几个月的注册倍数相关。也就是说,5 月 10 日注册人数激增,将导致 6 月 10 日、7 月 10 日和 8 月 10 日等终止人数增加,尽管效果会逐渐减弱。

我希望得到关于我可以使用哪些模型来模拟这个特定问题的提示。任何建议将不胜感激..

到目前为止,我一直在考虑一个 VAR 模型,但我不确定如何包含月度效应 - 使用非常高的滞后量或以某种方式添加季节性分量?

2个回答

滞后 29 到 31 的 CCF 图是什么样的?尖峰是否足够频繁以至于它出现?您可以使用 Granger 检验来检查哪些滞后值具有统计显着性。

月级机型

您应该捕获终止倾向的月份级别变化(例如,圣诞节假期期间的注册比四月期间的注册更有可能终止)。假设您通常的时间序列模型是:现在,如果您认为参数等是特定于月份的,您可以将月份指示器标志与剩余的预测变量进行交互。

terminationst=β1signupst1+β2signupst2+..
β1

因此,您的新功能形式将是 这类似于构建月份级别的模型,从而可以更灵活地捕获月份的特定变化趋势

terminationst=β1signupst1MonthFlagt1+β2signupst2MonthFlagt1+..