我可以用这两个时间序列做什么?

机器算法验证 时间序列
2022-04-11 19:12:34

在此处输入图像描述

信息:

蓝线是美国劳工统计局的官方通胀统计数据
红线是由声称创造了更好的通胀衡量方法的独立研究人员提供的

蓝线每月采样一次
红线每天采样

可以看出红色线在蓝线之前跟踪通货膨胀。


基本上,这是两个具有不同采样频率的时间序列,它们跟踪相同的现象,即总体价格水平的变化。我需要关于如何分析这些过程的建议。我可以测试哪些可能的假设?

更新:根据 mpiktas 的建议,我目前的计划是进行 MIDAS 回归,其中包含一些权重多项式函数并报告模型的预测能力。(也许将其与使用简单时间平均红线的模型进行对比)

你们中的一些人可能已经做过类似的事情,有什么我应该记住的或者我可以做的其他事情来补充这个 6000 字的项目吗?

额外的:

  • 如果您可以将我链接到一些非常相关的论文,这些论文进行了类似的分析,这将有所帮助。

任何输入将不胜感激

3个回答

为了用高频预测低频变量,您可以使用 MIDAS 回归。这个回归背后的想法很简单,平均高频变量,然后将其用作回归量。关键是使用自定义权重。假设我们有每天采样的那么MIDAS回归定义如下:YtXτ

Yt=h=0kβhXtmh+εt

我们假设对于观察我们有个观察我们还假设,对于某些函数和超参数t=smτ=smm+1,...,smβh=g(h,θ)gθ

因此,如果您想测试的良好预测器,请使用不同的权重函数拟合 MIDAS 回归并检查结果。XτYt

如果你将 MIDAS 回归输入谷歌,你会发现很多文章。Armesto、Engemann 和 Owyang在“混合频率预测”一文中研究了使用每日变量预测月度 CPI 。

MIDAS 回归的想法是由Eric Ghysels提出的,你可以看看他的文章。

有两个用于拟合 MIDAS 回归的软件包:MIDAS Matlab 工具箱midasr R 包它们都有用户指南,您可以在其中找到更详细的示例和其他文献的链接。

请注意,这只是解决问题的一种可能方法。其他人肯定也存在,但由于我是 midasr R 包的开发人员,我的建议有偏见。

首先,我会检查来自列表 A 的抽签是否是来自列表 B 的抽签之外的两个标准差。

其次,我会检查列表 A 的 1 个月移动平均值是否与采样速度较慢的列表 B 显着不同。

将季节性时间序列模型拟合到两者,然后比较季节性。TBATS 模型可以处理日常数据。它在 R 的预测包中可用。