在突然增加之前调整时间序列(增加的原因和时间已知)

机器算法验证 r 时间序列 调整 统计模型
2022-04-12 06:36:39

幅度有 2 次增加(2 月至 3 月之间有 1 次,9 月初有 1 次)在此处输入图像描述

(图表有每日分辨率顺便说一句)

假设每周季节性,是否可以得到注意到增加的确切日期和 1 周前的一天,计算新/旧比例因子并在使用该比例因子发生增加之前缩放所有内容?

此操作通常如何调用?人们通常如何做到这一点,仅仅是这种缩放还是有更正确(也许更复杂)的方法?

你会用什么来调整R或 Python 和statsmodels中的这个时间序列?有没有一个我可以阅读的例子,或者你能在这里描述一个吗?

(这两次增加有一个共同的原因。该图表显示了网站上某些帖子的计数。在两次增加的时候,有一个新的收集器推出,结果,更多的数据开始进入。所以我试图做的缩放是试图估计如果当前集合从 2015 年 1 月开始就到位,那么时间序列在增加之前的样子)

1个回答

检测和合并电平偏移(Step Shifts)是不可分割的一部分,或者是非因果建模和因果建模。经常使用术语干预检测。一些软件实现将识别限制为非因果模型,而另一些则没有。有关开创性文章,请参见http://www.unc.edu/~jbhill/tsay.pdf,并在此处使用字符串“intervention detection”搜索相关帖子。典型的输出将包括“没有干预的系列会是什么样子”。这些通常被称为“调整值”。

干预可能有一个“事实上的日期”和一个“法律上的日期”,通常是一致的,但有时不是由于系列中的动态。如果知道开始日期,则可以简单地添加一个指示变量(0,0,0,0,1,1,1,1..)来反映该知识,然后使用该变量的估计系数作为调整因子.

如果您知道干预发生在特定时间点,您可以估计一个模型,其中 I 是 0/1 干预变量,与 ARIMA 组件一起使用。

例如,如果您在两个时间点(39 和 21)有一个脉冲,则增强数据矩阵可能如下所示。

在此处输入图像描述

在此处输入图像描述