附带参数问题

机器算法验证 非线性回归 固定效应模型 偏见
2022-01-31 16:39:38

我一直在努力理解附带参数问题的真正本质。我曾多次读到,非线性面板数据模型的固定效应估计量可能会因为“众所周知的”附带参数问题而严重偏差。

当我要求对这个问题进行明确解释时,典型的答案是:假设面板数据在 T 个时间段内有 N 个个体。如果 T 是固定的,则随着 N 的增长,协变量估计值会出现偏差。这是因为随着 N 的增加,有害参数的数量会迅速增加。

我将不胜感激

  • 更精确但仍然简单的解释(如果可能)
  • 和/或我可以使用 R 或 Stata 解决的具体示例。
1个回答

在类型的 FE 模型中

yit=αi+βXit+uit
α是附带参数,因为从理论上讲,它是次要的。通常,β是重要的参数,从统计学上讲。但本质上,α 重要,因为它提供了有关单个拦截的有用信息。

大多数面板都很短,即T相对较小。为了说明附带参数问题,我将忽略β为简单起见。所以模型现在是:

yit=αi+uituitiiN(0,σ2)
因此,通过使用均值方法的偏差,我们有u^it=yity¯i- 这就是我们可以得到的α. 让我们来看看估计σ2
σ^2=1NTit(yity¯i)2=σ2χN(T1)2NT=σ2N(T1)NT=σ2T1T

你可以看到,如果 T 是“大”,那么术语T1T消失,但是,如果 T 很小(大多数面板都是这种情况),那么估计σ2会不一致。这使得 FE 估计量不一致。

原因β通常是一致的,因为通常 N 确实足够大,因此具有所需的渐近要求。

请注意,例如在空间面板中,情况正好相反——T 通常被认为足够大,但 N 是固定的。所以渐近线来自 T。因此在空间面板中你需要一个大的 T!

希望它以某种方式有所帮助。