伪 R^2 小于 0.5 的 logit 模型是否比抛硬币更糟糕?

机器算法验证 解释 r平方 罗吉特
2022-03-31 07:00:07

我最近遇到这样的说法,如果一个 logit 模型的伪低于,那么结果完全没有价值,因为抛硬币是一个更好的模型。这种解释正确吗?如果不是,它有什么问题?R20.5

R2=#CorrectTotal count

1个回答

(正确百分比)/(总计数)通常称为正确分类率。这不是伪 R 平方指标之一,它通常被认为是评估模型拟合的劣等方法,因为它简化了很多;它没有考虑从观察到观察的预测概率差异。

正如@A 所指出的,伪 R 平方可以通过几种不同的方式计算。Webb 和@kjetil b halvorsen,但是通过这些方法中的任何一种,在几百或一千个样本中,结果不仅是 0.50,甚至是 0.03,都将反映一个信息量更大的模型和/或比简单的抛硬币更好的决策指南。这可以通过比较模型生成的预测概率的两种分布来具体看出:一种用于因变量为“1”的观察,另一种用于“0”的观察。“1”的预测概率相对于“0”的预测概率将明显向右移动。与基于抛硬币的空模型相比,ROC 曲线也将为该模型标出明显更多的区域。