问题
我有一台机器在两个不相交的时间段内生成的时间序列数据——大约是 2016 年的一个月和 2018 年的另一个月。
领域专家假设在每个时间步,观察到的变量可以用另一组观察到的变量来解释。
我如何测试这个过程是否随着时间的推移而改变?请注意,我并不是要测试变量的分布是否随时间变化。我想测试和之间的关系是否随着时间而改变。
目前的方法
假设我在 2016 年的数据上拟合了一个时间序列模型(例如,高斯过程)来预测给定作为对生成的基础过程进行建模的一种方式。
领域专家建议,也许我们可以尝试使用这个模型来预测给定 s并以某种方式使用残差来推断该模型(代表 2016 年的过程)是或正在2018 年不再一样。我不确定在此之后如何继续。
我在考虑什么
我应该测试 2016 年和 2018 年的残差是否来自同一分布,还是使用 Kolmogorov-Smirnov 测试之类的方法进行拟合优度测试?我对这种方法的担忧是,2018 年的样本外数据可能比 2016 年的样本内训练数据具有更大的误差,因此该测试可能会产生误报。有没有办法调整/解释这种影响?
我应该安装两个模型,一个用于 2016 年,另一个用于 2018 年,并使用某种方式来测试这两个模型是“相同”还是“不同”?例如,一种可能性是计算分别在 2016 年和 2018 年数据上拟合的 2 个高斯过程之间的 KL 散度。这种方法还有其他建议或问题吗?
我看到了一些关于协整的帖子。但我并不完全理解这个概念。这相关吗?
一般来说,如何解决这类问题?我试过在网上搜索这个,但可能是由于我的查询不够精确(我对这个领域不熟悉),我没有得到很多相关的结果。我什至感谢对要搜索的主题/关键字或要浏览的书籍/论文的简单提示/评论。
请注意,我正在寻找有原则的(最好是统计的)方法,而不是基于启发式的方法。很好的例子是建议下面的 Chow 测试及其变体的答案。