逻辑回归中的截距项

机器算法验证 物流 解释 截距
2022-02-08 14:13:02

假设我们有以下逻辑回归模型:

logit(p)=β0+β1x1+β2x2

β0事件发生的几率x1=0x2=0? 换句话说,这是事件发生的几率x1x2处于最低水平(即使这不是 0)?例如,如果x1x2只取值23那么我们不能将它们设置为 0。

3个回答

β0不是事件的几率x1=x2=0,这是赔率的日志此外,只有x1=x2=0,而不是当它们处于最低的非零值时。

也可能有这样的情况x1x2不能等于0同时。在这种情况下β0没有明确的解释。

除此以外β0有一种解释——如果没有一个变量不能做到这一点,它会将赔率的对数转换为其实际值。

建议换个角度看。。。

在逻辑回归中,我们通过计算似然概率来预测一些二元类 {0 或 1},这是实际输出logit(p).

当然,这是假设对数赔率可以合理地用线性函数来描述——例如,β0+β1x1+β2x2+

......这是一个很大的假设,只有在某些时候才成立。如果那些xi组件对对数赔率没有独立的比例影响,那么最好选择另一个统计框架。即,对数赔率由一些固定分量组成β0, 并随着每个连续项递增,βixi.

简而言之,β0value 是该组件方法的“固定组件”,用于描述您尝试预测的任何事件/条件的对数几率。还要记住,回归最终描述的是一些条件平均值,给定一组xi价值观。这些都不需要xi-值在您的数据中为 0,甚至在现实中可能。β0简单地向上或向下移动该线性表达式,以使变量分量最准确。

也许我以稍微不同的心态说了同样的话,但我希望这会有所帮助......