季节性调整后的逐月增长,具有潜在的每周季节性

机器算法验证 r 时间序列 季节性 预测
2022-03-13 22:10:49

作为业余爱好,我一直在探索预测时间序列(特别是使用 R)。

对于我的数据,我有每天的访问次数,每天可以追溯到近 4 年。在这个数据中有一些不同的模式:

  1. 周一至周五有很多访问量(周一/周二最高),但周六至周日则大幅减少。
  2. 一年中的某些时候下降(即美国假期前后访问量减少,夏季显示增长较少)
  3. 逐年显着增长

如果能够使用这些数据预测即将到来的一年,并使用它来进行季节性调整的月度增长,那就太好了。月度视图让我大吃一惊的主要事情是:

  • 某些月份的星期一/星期二会比其他月份多(而且多年来也不一致)。因此,发生在更多工作日的月份需要相应调整。

探索周似乎也很困难,因为周编号系统会根据年份从 52 到 53 变化,而且似乎ts无法处理。

我正在考虑取一个月中工作日的平均值,但结果单位有点奇怪(平均工作日访问量的增长),这将丢弃有效的数据。

我觉得这种数据在时间序列中很常见(例如,办公楼的用电量可能是这样的),任何人对如何建模它有任何建议,特别是在 R 中?

我正在使用的数据非常简单,它开始于:

            [,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467

这种情况一直持续到现在,总体呈增长趋势,在美国假期周期间有所下降,夏季增长普遍放缓。

1个回答

我一直在建模这样的数据。你需要加入

  • 一周中的天
  • 假日效应(领先、同期和滞后效应)
  • 每月的特殊日子
  • 可能是假期前的星期五或假期后的星期一
  • 每周效果
  • 每月效果
  • ARIMA 结构来渲染错误白噪声;
  • 等人 .

统计方法称为带有干预检测的传递函数建模。如果您想通过 dave@autobox.com 或最好通过 SE 私下分享您的数据,我将非常乐意向您展示最终模型的具体细节,并进一步提高您自己做的能力,或者至少帮助您和其他人了解需要做什么以及可以做什么。无论哪种情况,您都会变得更聪明,而无需花费任何金钱或时间。您可以阅读我对时间序列问题的其他一些回复以了解更多信息。