关于 probit 和 logit 模型的说明

机器算法验证 罗吉特 概率
2022-04-16 10:47:12

我知道在这个问题中对 probit 和 logit 模型的技术差异有很好的解释但是,我会很感激一些常识性的澄清,这在决定使用哪种模型时非常有帮助。

所以让我们考虑这个模型:

Prob(y=1|x)=G(β0+xβ)

其中是相应的链接函数。 G(z)

在此处输入图像描述

  1. 当内部线性模型产生时z=0,probit 和 logit 都预测 50% 的概率y=1和 50% 的概率,我是否理解正确y=0

  2. 我知道选择哪种模型没有任何一般规则,但是应该考虑的差异之一是曲线(尾部)的形状略有不同。再说一次,如果我说 logit 模型将概率“传播”到更广泛的值范围内,我是对的z吗?也就是说,probit 将预测负值的概率z低于 logit?

1个回答

让我从几个挑剔的细节开始:我们通常将链接函数称为应用于 LHS,而将链接函数的 函数应用于 RHS。因此,最好写成:其次,如果 y=1 的概率是 50%,那么 y=0​​ 的概率也一定是 50%,所以最好不考虑。Prob(y=1|x)=G1(β0+xβ)

  1. 是的,在 logit 和 probit 链接函数的情况下,当线性预测变量z总和为0时,预测概率y=1但是,这有点棘手。人们通常谈论当 时会发生什么,在这种情况下,您预测的概率为g ,如果,则只有0x=0y=1g1(β0)50%β^0=0

  2. 概率分布在比概率更广泛的范围内是不太正确的。它们都在范围内。相反,它们在接近边界和“转弯”时预测概率的变化率不同。我认为可能导致您遇到困难的主要问题是的拟合值会因您使用 logit 还是 probit 而有所不同。logit 链接的斜率将大于 probit 链接的斜率。因此,在你的情节中看起来有很大差异的东西大部分都会消失。 (0, 1)β^1