作为业余爱好,我一直在探索预测时间序列(特别是使用 R)。
对于我的数据,我有每天的访问次数,每天可以追溯到近 4 年。在这个数据中有一些不同的模式:
- 周一至周五有很多访问量(周一/周二最高),但周六至周日则大幅减少。
- 一年中的某些时候下降(即美国假期前后访问量减少,夏季显示增长较少)
- 逐年显着增长
如果能够使用这些数据预测即将到来的一年,并使用它来进行季节性调整的月度增长,那就太好了。月度视图让我大吃一惊的主要事情是:
- 某些月份的星期一/星期二会比其他月份多(而且多年来也不一致)。因此,发生在更多工作日的月份需要相应调整。
探索周似乎也很困难,因为周编号系统会根据年份从 52 到 53 变化,而且似乎ts
无法处理。
我正在考虑取一个月中工作日的平均值,但结果单位有点奇怪(平均工作日访问量的增长),这将丢弃有效的数据。
我觉得这种数据在时间序列中很常见(例如,办公楼的用电量可能是这样的),任何人对如何建模它有任何建议,特别是在 R 中?
我正在使用的数据非常简单,它开始于:
[,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467
这种情况一直持续到现在,总体呈增长趋势,在美国假期周期间有所下降,夏季增长普遍放缓。