如何判断统计模型是否“已识别”?

机器算法验证 回归 计量经济学 模型 可识别性
2022-03-07 04:59:18

我的计量经济学教授在课堂上使用了“确定”一词。形式的数据生成过程, 其中是随机变量,是随机误差项。我们的回归线形式为

Y=β0+β1X+U
XU
Y=β0^+β1^X

他给出了以下“已识别”的定义:

β0如果数据集包含足够的信息来“确定” \beta_0 , \beta_1 的唯一值,识别β1{Xn}i=1β0β1

我对这个定义不满意,因为他既没有具体说明什么是“信息”,也没有具体说明“固定”是什么意思。

一点上下文

在我们的一个练习中,我们得到了根据我的教授的说法,这违反了一个称为“外生性”的假设,这是一个模型“可识别”所必需的。E[UX]=α0

具体来说,根据他的讲义,

外生性假设:误差项与回归量不相关,或者对于所有通过假设,这可以重写为对于所有Cov(Un,Xnk)=0k=1,2,3...,KE(Un|Xn1,Xn2,...,XnK)

Cov(Un,Xnk)=E(UnXnk)=0
k=1,2,3...,K

在我们的问题中,他似乎试图让我们理解为什么如果这种外生性假设失败,则无法识别模型。因此,希望这可以为回答者提供有关他如何使用该术语的背景信息。

我的问题

有人可以澄清他所说的“信息”和“固定”是什么意思吗?或者完全给出一个更好的定义。

编辑:

摘自维基百科:

观察等效 --- 如果两个参数值都导致可观察数据的相同概率分布,则它们被认为是观察等效的。

已识别 --- 任何情况下,统计模型总是具有一组以上的参数,这些参数会产生相同的观察分布,这意味着多个参数化在观察上是等效的。

这仍然不能真正解释“外生性”的来源以及为什么与“被识别”有关。

1个回答

可识别性基本上是指模型参数是否存在一致的估计量。换句话说,如果我们被告知数据的分布,我们可以恢复模型参数吗?如果不是,那么我们的模型是无法识别的。

无法识别模型的最简单示例可能是过参数化方差分析模型。该模型采用以下形式

Yij=μ+αi+ϵij

在哪里μ{αi}i=1k是任意常数和ϵij普通的(0,σ2). 如果我们得到的信息是Yij普通的(μi,σ2)对于一些常数集{μi}i=1kσ2, 重要的是要注意,这是我们希望从数据中学到的全部内容,那么没有唯一的方法可以将其转换回常量μ,{αi}i=1kσ2. 这是因为我们总是可以采取μ+cαic达到相同的平均参数μi=μ+αi对于不同的模型参数值。即使我们有无限的数据,我们也永远无法恢复这些值。出于这个原因,我们施加了约束i=1kαi=0这保证了模型和分布参数之间的一对一映射。