内生性与未观察到的异质性

机器算法验证 回归 假设
2022-01-25 16:26:07

内生性和未观察到的异质性有什么区别?我知道内生性来自例如遗漏变量?但据我了解,未观察到的异质性会导致同样的问题。但是,这两个概念之间的区别究竟在哪里呢?

4个回答

我同意@Michael 对内生性的描述——这是关于您包含的变量及其与您不包含的变量的关系的问题(即错误术语中的内容)。

未观察到的异质性通常与您正在估计的影响的不可观察成分有关。继续@Michael 的教育示例,未观察到的异质性可能是某些人从上学获得的回报(例如,工资增加)比其他人更高。让回报为人iβ+biE(bi)=0. 我们有

yi=xi(β+bi)+wiγ+ϵi,
在哪里yi是(通常是对数)收入,xi是教育年限,并且wi是一组其他控件。内生性的一个例子是当xiϵi(例如,教育与智商相关,而智商不在我们的其他预测因素中)。

如果我们估计一个系数,我们有

yi=xiβ+wiγ+(ϵi+bxi)=xiβ+wiγ+ϵ~i
看到包含的变量xi与误差项相关ϵ~i,引发与内生性情况相同的问题。

术语内生性和未观察到的异质性通常指的是同一件事,但用法有所不同,即使在经济学中,我最常与这些术语联系在一起的学科也是如此。

在回归方程中,如果解释变量与误差项相关,则解释变量是内生的。

内生性通常被描述为具有三个来源:遗漏变量、测量误差和同时性。尽管单独提及这些“来源”通常会有所帮助,但有时会出现混淆,因为它们并不是真正不同的。想象一个预测教育对工资影响的回归。也许我们衡量教育的标准只是某人接受正规教育的年数,而不管教育类型如何。如果我清楚了解哪种教育类型会影响工资,我可能会将这种情况描述为教育变量中的测量误差。或者,我可以将这种情况描述为遗漏变量问题(表示教育类型的变量)。

也许工资也会影响教育决策。如果同时测量工资和教育,这是同时性的一个例子,但它也可能会根据遗漏变量进行重构。

未观察到的异质性只是未测量的案例之间的变化/差异。如果您了解内生性,我认为您了解在回归环境中未观察到的异质性的含义。

我理解异质性是个体之间的任何差异。观察到的异质性通常由协变量组成,而未观察到的异质性由任何未观察到的差异(如能力或努力)组成。

内生性是指观察到的变量和未观察到的变量之间的关系,即它们相互依赖。

总结一下:

  • 未观察到的异质性是内生性的可能原因之一。
  • 因此,内生性是更广泛的术语。
  • 未观察到的异质性意味着内生性,但反之则不然。