时间序列的最佳统计测试是什么?

机器算法验证 时间序列 统计学意义
2022-02-06 03:34:50

我有一个简单的时间序列,每个数据集定期有 5-10 个数据点。我想知道确定两个数据集是否不同的最佳方法是什么。我应该对每个数据点进行 t 检验,还是查看曲线下的区域,或者是否有某种多变量模型可以更好地工作?

3个回答

您需要准确说明“不同”的含义。您还需要指定您愿意对每个时间序列中的序列相关结构做出哪些假设。

使用 t 检验,您正在比较每个组的平均值,并且假设这些组由具有相等方差的独立观察值组成(后者有时是放松的)。在测试时间序列时,独立性的假设通常是不合理的,但是您需要将其替换为指定的相关结构——例如,您可能假设时间序列遵循具有相等自相关性的 AR(1) 过程。因此,即使比较两个或多个时间序列的均值也比使用独立数据困难得多。

我会仔细指定我愿意对每个时间序列做出哪些假设,以及我希望比较什么,然后使用参数引导程序(基于假设模型)进行测试。

也许重复测量 anova 是你想要的。它允许您比较主题(主题间因素),同时采用每个主题的“时间序列”的相关结构(主题内因素)。这是一种简单但过时的方法,可以在“一般线性模型”的上下文中找到,它需要一些额外的特征(例如球形)。另一种方法可以是混合线性模型,它允许更一般的相关结构(甚至像 Rob 建议的 AR(1))和不平衡数据。

如果要假设简单的线性趋势,可以取每个数据集在各个时间点的差异,并测试线的斜率是否为零。

——拉尔夫·温特斯