应用 Tobit 回归模型的假设是什么?

机器算法验证 回归 假设
2022-03-17 09:43:51

我对 Tobit 回归模型的(非常基本的)知识不是来自课堂,就像我希望的那样。相反,我通过几次互联网搜索在这里和那里收集了一些信息。我对截断回归假设的最佳猜测是它们与普通最小二乘 (OLS) 假设非常相似。不过,我不知道这是否正确。

因此我的问题是:在执行 Tobit 回归时我应该检查哪些假设?

注意: 这个问题的原始形式是指截断回归,这不是我使用或询问的模型。我已经纠正了这个问题。

4个回答

如果我们寻求一个简单的答案,那么Wooldridge 书(第 533 页)的摘录非常合适:

... 异方差性和非正态性都导致 Tobit 估计量不一致出现这种不一致是因为给定的派生密度关键取决于Tobit 估计量的这种非鲁棒性表明数据审查可能非常昂贵:在没有审查的情况下 ( )可以在 [甚至 ]。β^βyxy|xNormal(xβ,σ2)y=yβE(u|x)=0E(xu)=0

这段摘录中的符号来自 Tobit 模型:

y=xβ+u,u|xN(0,σ2)y=max(y,0)
观察到 yxyx

总结最小二乘法和Tobit回归之间的差异是后者的正态性固有假设。

另外,我一直认为Amemyia 的原始文章很好地阐述了 Tobit 回归的理论基础。

回应 Aniko 的评论:主要假设是存在截断。这与您的帖子向我建议的其他两种可能性不同:有界性和样本选择。

如果您有一个基本有界的因变量而不是截断的因变量,您可能希望转移到一个广义线性模型框架,该框架具有 Y 的一种(较少选择的)分布,例如对数正态、伽马、指数等,它尊重下限。

或者,您可能会问自己,您是否认为在模型中生成零观测值的过程与在您的应用程序中生成严格正值(价格)的过程相同。如果不是这种情况,那么样本选择模型类(例如 Heckman 模型)中的某些东西可能是合适的。在这种情况下,您将处于指定一个模型愿意支付任何价格的情况,以及另一个模型说明如果您的受试者想要支付某物,他们将支付什么价格。

简而言之,您可能想要查看假设截断、删失、有界和样本选择的因变量之间的区别。您想要哪一个将来自您的应用程序的详细信息。一旦做出第一个最重要的假设,您就可以更轻松地确定您是否喜欢所选类别中任何模型的特定假设。一些样本选择模型的假设相当难以检查......

@Firefeather:您的数据是否仅包含(并且只能真正包含)正值?如果是这样,请使用具有伽马误差和日志链接的广义线性模型对其进行建模。如果它包含零,那么您可以考虑两个阶段(零概率的逻辑回归和正值的伽马回归)。后一种情况也可以使用零膨胀伽马建模为单一回归。几年前在 SAS 列表中给出了一些很好的解释。如果有兴趣,请从这里开始并搜索后续行动。 链接文本

如果截断回归结果不可信,可能会帮助您指出另一个方向。

正如其他人在这里提到的那样,tobit 回归的主要应用是对数据进行审查。Tobit 与数据包络分析 (DEA) 和经济学家一起广泛使用。在 DEA 中,效率得分介于 0 和 1 之间,这意味着因变量在左起 0 和右起 1 处被删失。因此,线性回归(OLS)的应用是不可行的。

Tobit 是概率和截断回归的组合。在区分删失和截断时必须小心:

  • 审查:当样本中存在极限观测值时。因变量值在左侧或右侧达到极限。
  • 截断:研究中不包括特定范围的相关值的观察。例如,只有正值。截断比删失具有更大的信息损失。

Tobit = Probit + 截断回归

Tobit 模型与 probit 模型一样假设正态性。

脚步:

  1. Probit 模型决定因变量是 0 还是 1。 如果因变量是 1,那么多少(假设审查为 0) .

    (Discreet decision)P(y>0)=Φ(xβ)

  2. (Continuous decision)E(yy>0)=xβ+σλ(xβσ)

两个决策模型的系数相同。是调整删失值(零)的校正项。 βσλ(xβσ)

还请检查 Cragg 的模型,您可以在每个步骤β