变量差异时的通常回归与回归

机器算法验证 回归 时间序列
2022-03-05 01:59:38

我只是想了解当变量存在差异时,正常的多重/简单回归与多重/简单回归之间的关系是什么。

例如,我正在分析存款余额 ( ) 与市场利率 ( )之间的关系因变量的差异和自变量的差异,所以我的方程现在是回归,我的相关性和 R^2 根本不显着( )。YTRTdln(YT)dR(T)R2=.004

我只是想知道这个低是否意味着什么?这是否意味着我的模型不合适,或者我在查看差异数据时我从数据中知道原来的两个变量之间存在显着的相关性,但是对于我的模型,我需要查看不同的变量,所以只是想知道如何去做。R2R2

3个回答

简单的版本是,任何两个随时间趋向于一个方向变化的变量似乎都是相关的,无论它们之间是否存在任何联系。考虑以下变量:

set.seed(1)
time = seq(from=1, to=100, by=1)
x  = .5 + .3*time +        rnorm(100)
y1 =  3 + .3*time +        rnorm(100)
y2 =  7 + .1*time + .8*x + rnorm(100)

x只是时间的函数,也是如此。 是时间和的函数。关键是从代码中认识到之间没有关系现在看下图,所有三行看起来都非常相似,不是吗?y1y2xxy2xy1

在此处输入图像描述

实际上,的关系值是 98%,99%。但是我们知道之间没有真正的关系,而R2xy1R2xy2xy1xy2,那么我们如何区分真实与单纯的外观呢?这就是差异出现的地方。对于任何两个变量,由于它们都倾向于随着时间的推移而上升,这不是很有信息,但是鉴于一个上升了某个特定的数量,这是否告诉我们另一个上升了多少?差异化让我们能够回答这个问题。请注意以下两个数字,我在对所有三个变量进行差分后制作的散点图。

在此处输入图像描述

在此处输入图像描述

在这里,我们清楚地看到,知道上升了多少 可以告诉我们上升了多少(的情况并非如此)。因此,您的问题的答案是您应该忽略原始变量之间的相关性并查看差异变量。鉴于您的是 0.004,我会说没有实际关系。 xy2R2=.43xy1R2=.07R2

其他几点:在图中,我特别指出这些是同时发生的变化。这并没有错,它遵循我设置问题的方式,但通常人们对一些滞后的效果感兴趣。(也就是说,在某一时间点改变一件事会导致后来改变另一件事。)其次,你提到记录你的一个系列的日志。获取日志只是将您的数据从级别切换到速率。因此,当您进行差异化时,您关注的是利率的变化而不是水平的变化。这很常见,但我没有在演示中包含该元素;它与我讨论的问题正交。最后,我想承认时间序列数据通常比我的演示更复杂。

@gung 提供了一个很好的答案,但我想对您的建议提出一些警告。

差分主要用于解决单位根问题,例如,当过程是相关系数为 1 的 AR(1) 时。当误差项为白噪声时,差分可以有效地去除线性时间趋势(在特别是,它没有表现出序列相关性),如上面@gung 所示。但是,如果误差项具有绝对值相关系数小于1的序列相关性,则使用差分去除线性时间趋势会产生结构非常复杂的误差。在这种情况下,很难获得准确的标准误并做出有效的推论。

因此,最好先测试单位根,如果检测到单位根,则通过差分来修复它。接下来,检查线性时间趋势。通过去趋势解决这个问题。如果不做后者,您就会对@gung 很好地说明的省略变量类型问题持开放态度。

当目标是形成/识别两个或多个系列之间的关系时,可能需要过滤固定 X 变量以将其转换为噪声。这是一个两步过程,需要差分和 ARMA 结构。为了保持客观性并避免模型规范偏差,不应假设过滤器,而是使用固定 X 系列的自相关性质构造该过滤器。然后采用 Y 系列并应用任何必要的差分算子使其静止,然后将先前开发的滤波器应用于静止 Y 。这个过程只有一个目标,那就是确定 Y 和 X 之间的关系。永远不要对所需的差分运算符下结论,ARMA 过滤器和变量之间的关系,除非是一位在观察数据之前就知道模型的计量经济学家,或者如果您直接与全能者交谈。有必要对误差要求的正态性进行仔细分析,以相信任何可以计算的统计检验。F 检验/T 检验的计算是必要的,但还不够。总之,我建议您学习“如何识别传递函数模型”这一主题。其他人和我已经多次讨论过这个问题。如果您愿意,可以细读一些带有“时间序列”标签的问题的答案。正如瑜伽士所说:“您可以通过阅读/观看来观察很多东西”。有时,漂亮而简单的答案可能会使您误入歧途,并且像我这样可能过于复杂/保守的答案可能需要您对建模时间序列数据有更好的理解。正如曾经说过的“托托,我们不在堪萨斯(即横截面数据)了!”