二元结果模型中的非经典测量误差

机器算法验证 测量误差 概率
2022-03-23 07:04:39

我有一个二进制结果模型,我用概率估计,所以

Pr(Y=1|x,z)=Φ(α+βx+zγ)

我对xPr(Y=1|x,z)的边际效应感兴趣。z s 是没有测量​​误差的其他协变量

不幸的是,我没有观察到x我看到xx也就是说,xx的向下偏置版本。在我的设置中,x是事件发生后的持续时间,但是人们以不同的方式注意力不集中,因此他们响应的实际持续时间总是比测量的持续时间长。这种差距因人而异。

  1. 从我所做的一些模拟中,边际效应减弱(偏向于零)。在我可以引用的文献中是否有对此的分析证明?
  2. 我能做些什么来弥补偏差或量化其幅度吗?

我宁愿坚持使用概率设置,但如果它使事情变得更容易,那么使用线性概率模型是可以接受的。删除其他协变量也可以。

1个回答

引用Chen 等人的调查文章。(2011) “测量误差的非线性模型”,经济文献杂志:

近似偏差取决于回归函数相对于误测回归器的导数以及真实回归器和误测回归器的分布函数的曲率。在局部,给定错误测量回归变量的因变量的条件均值函数比给定真实回归变量的条件均值函数更平滑,类似于线性模型中回归系数的衰减偏差。

这是Chesher (1991)的结果。Carroll et al (1984)推导出了具有测量误差的二元回归模型中的偏差。调查文章讨论了非线性模型中的几种类型的测量误差以及解决它的潜在方法。

对于 Stata 中的实际实现,请查看 Stata 站点,标题为“用于广义线性测量误差模型的 Stata 软件”[链接]。如果您对测量误差的方差有所了解,那么事情似乎变得不那么复杂了。