我正在做一个跨国小组,想知道是否包含时间。
我已经看到人们在回归中放置了每年的时间虚拟变量,而其他人则放置了单个时间趋势变量。大概是本领域从业者所熟知的,但它们之间有什么区别和解读呢?什么时候应该使用时间趋势,什么时候应该使用时间假人?
非常感谢。
我正在做一个跨国小组,想知道是否包含时间。
我已经看到人们在回归中放置了每年的时间虚拟变量,而其他人则放置了单个时间趋势变量。大概是本领域从业者所熟知的,但它们之间有什么区别和解读呢?什么时候应该使用时间趋势,什么时候应该使用时间假人?
非常感谢。
我也问过自己这个问题,这就是我看待它的方式:
假设您的回归模型是
时间假人
其中是虚拟的系数,后者等于一年,其他地方为零。对于任何给定的年份,您可以通过将设置为您评估的年份来评估函数,在其他地方设置为零。这给了你:
因此,您有一个特定年份的大小影响您的所有单位的效果。如果您怀疑对那一年有特定的影响,并且希望对它们进行建模,我认为这种方法最合适。例如,给定年份的班级学生质量可能会表现出特定年份的变化。
时间趋势
其中是时间趋势以等步增加的系数,例如年。要获得可解释的表达式,您可以使用导数:
因此,从一年到另一年,即将增加一个单位,会对结果变量因此,您有一个线性趋势,可以将其解释为您的结果随时间变化的总体方向。您假设您估计的影响并不特定于任何给定的年份,但产生变化的过程会跨越多年 - 至少我是这么认为的。
在我看来,更多的是你想要估计的问题。特定年份的变化或趋势(或者您可能想比较哪些模型最合适)。
前言:我在这里假设建模时间是次要问题(即,您想要控制时间的影响以便更准确地捕捉主要影响)
这是一个吝啬的问题。
如果您的时间趋势可以通过线性趋势项或线性加二次趋势项(或者可能更复杂的东西)很好地近似,您应该选择那些代替时间虚拟变量。假设许多时间段,更简单的线性或二次时间趋势项将导致模型更加简洁。但是,如果您没有理由相信随时间推移的趋势如此简单,那么坦率地说,如果您能够承受附加参数的复杂性,那么假人是一个更安全的选择。
当 2 个时间序列完全由时间驱动(增加或减少)时,它们的相关性或回归是虚假的。原因是这样的:这两个系列只是由于时间而增加或减少,但它们不一定共同移动,即移动模式可能不一致。这种时间运动可以通过时间趋势变量本身来捕捉,我们不需要任何变量来解释除时间趋势之外的因变量的变化。这意味着因变量仅与时间高度相关,而不是任何其他变量。相反,如果因变量运动与自变量运动的相关性大于时间,则两个变量之间存在非虚假和真实的相关性。这种变量和时间之间的联动比较可以很容易地通过它们之间的相关性来判断。通常,如果 dep var 和 indep var 之间的相关性高于 dep var 和 time 之间的相关性,则 indep 变量确实与 dep var 相关,毫无虚假关系。如果不是,那么是时候处理因变量和自变量在回归模型中无用或不显着的移动了。因此,通过摄取时间趋势变量,我们控制模型中的时间效应,以获得 dep 和 indep 变量之间的真实和非虚假关系。