如何在时间序列中选择分析单位(聚合级别)?

机器算法验证 时间序列 聚合 分解
2022-03-08 21:47:30

如果您可以及时测量任何精度级别的时间序列观察,并且您的研究目标是确定 X 和 Y 之间的关系,那么是否有任何经验理由可以选择特定级别的聚合而不是另一个,或者应该只是根据理论和/或实际限制做出选择?

对于这个主要问题,我有三个子问题:

  1. X 或 Y 在较大级别内的任何非随机变化是否足以有理由选择较小级别的聚合(其中非随机是观察的任何时间模式)?

  2. X 和 Y 之间的关系在较小的聚合水平上的任何变化是否足以证明较小的分析单元是合理的?如果某些变化是可以接受的,那么如何确定有多少变化是太多了?

  3. 人们能否引用他们认为对于一个分析单元比另一个分析单元具有说服力/定义明确的论点,无论是出于经验原因还是出于理论原因?

我很清楚空间分析中的可修改面积单位问题Openshaw 1984)。我并不声称自己是该材料的专家,但到目前为止我所想的是,更小的分析单位总是更好,因为一个人不太可能犯生态谬误(Robinson 1950)。如果有人对聚合地理单位有直接相关的参考或答案,我也将不胜感激。

1个回答

介绍

我对这个主题的兴趣现在大约是 7 年,并产生了博士论文时间序列:聚合、分解和长记忆,其中关注 AR(1) 方案的横截面分解问题的具体问题。

数据

使用不同的聚合方法,您需要澄清的第一个问题是您处理的数据类型(我的猜测是空间数据,最令人兴奋的数据)。在实践中,您可能会考虑时间聚合(参见Silvestrini, A. 和 Veridas, D. (2008))、横截面(我喜欢Granger, CWJ (1990)的文章)或时间和空间两者(很好地调查了空间聚合在Giacomini, R. 和 Granger, CWJ (2004 ) 中。

答案(冗长)

现在,回答你的问题,我先给出一些粗略的直觉。由于我在实践中遇到的问题往往是基于不精确的数据(安迪的假设

您可以以任何时间精度水平测量时间序列的观察结果

对于宏观计量经济学似乎太强了,但对金融和微观计量经济学或任何实验领域都有好处,如果你确实控制得很好)我必须记住,我的每月时间序列不如我工作时那么精确年度数据。除了至少在宏观经济学中更频繁的时间序列确实有季节性模式,这可能会导致虚假结果(季节性部分确实与系列无关),因此您需要对数据进行季节性调整 - 另一个较低精度的来源,用于较高频率的数据。使用横截面数据显示,高度分解会带来更多问题,可能需要处理很多零。例如,数据面板中的特定家庭可能每 5-10 年购买一次汽车,但对新车(二手)汽车的总需求要平稳得多(即使对于小城镇或地区)。

弱点聚合总是导致信息丢失,您可能拥有整个十年(例如 2001-2010 年期间)欧盟国家横截面的 GDP,但考虑到详细的面板数据集,您将失去分析中可能存在的所有动态特征。大规模的横截面聚合可能会变得更加有趣:粗略地,您将简单的事情(短记忆 AR(1))在相当大的人群中平均,并获得与微观无关的“代表性”长记忆代理单位(代表代理人的概念又多了一块石头)。所以聚合〜信息丢失〜对象的不同属性,您希望控制这种丢失和/或新属性的级别。在我看来,最好以尽可能高的频率获得精确的微观数据,但是......

从技术上讲,您确实需要更多的空间(自由度)来或多或少地确信(至少)在统计上您的结果不是垃圾,尽管它们仍然可能是理论和垃圾:) 所以我确实需要更多的空间(自由度)问题 1 和 2 的权重(通常选择季度数据进行宏观分析)。回答第三个子问题,您在实际应用中决定什么对您更重要:更精确的数据或自由度。如果您考虑到上述假设,则最好使用更详细(或更高频率)的数据。

如果有的话,可能会在经过某种讨论后对答案进行编辑。