Tobit 回归的 Scale 或 Sigma 参数到底是什么?

机器算法验证 r 回归 tobit回归
2022-04-11 22:00:16

这个关于该主题的最受好评的 CV 答案中,在 tobit 回归输出中抛出的“比例”参数(在 Stata 中又称为“sigma”)被解释为“残差的估计标准偏差”。(因为问题已经超过三年了,所以我决定开一个新的。)“这个值可以与[因变量]的标准偏差进行比较。如果它小得多,[我们]可能有一个相当好的模型。”

但是,当我查看残差的标准偏差时,这些值将不匹配。sd实际上“规模”是残差的两倍多!

例子

library(AER)
data(Affairs)
fit <- tobit(affairs ~ age + yearsmarried + religiousness +
               occupation + rating, data=Affairs)

fit$scale  # the "scale" value
# [1] 8.24708

sd(resid(fit))  # sd of residuals
# [1] 4.140131

sd(Affairs$affairs)  # sd of dependent variable
# [1] 3.298758

我误解了那个答案,还是有缺陷?有人可以澄清关于tobit回归的“Scale”(Stata:“Sigma”)参数的这种困惑吗?它是如何计算的,它告诉我们关于模型质量的什么信息?

1个回答

Tobit 回归假设存在一个可以取任何值的潜在因变量。它是具有正态分布误差项的正态线性回归方程的一部分。该误差项的标准偏差是比例参数。然而,tobit 模型假设该潜在变量仅在超过特定下限(通常为 0)时才被观察到,否则观察到的变量将获得该下限的值。所以,是的,尺度参数类似于残差的标准差,但你不能通过从观察到的因变量中减去预测值来估计这些残差。这可能就是你所做的,它会低估你观察到的方差。