机器算法验证 - 逻辑回归中的截距项 - 吾爱随笔录

逻辑回归中的截距项

机器算法验证物流解释截距

2022-02-08 14:13:02

假设我们有以下逻辑回归模型：

logit (p) = β_{0} + β_{1} x_{1} + β_{2} x_{2}

$\text{logit}(p) = \beta_0+\beta_{1}x_{1} + \beta_{2}x_{2}$

是 $\beta_0$ 事件发生的几率 $x_1 = 0$ 和 $x_2=0$ ? 换句话说，这是事件发生的几率 $x_1$ 和 $x_2$ 处于最低水平（即使这不是 0）？例如，如果 $x_1$ 和 $x_2$ 只取值 $2$ 和 $3$ 那么我们不能将它们设置为 0。

3个回答

$\beta_0$ 不是事件的几率 $x_1 = x_2 = 0$ ，这是赔率的日志。此外，只有当 $x_1 = x_2 = 0$ ，而不是当它们处于最低的非零值时。

也可能有这样的情况 $x_1$ 和 $x_2$ 不能等于 $0$ 同时。在这种情况下 $\beta_0$ 没有明确的解释。

除此以外 $\beta_0$ 有一种解释——如果没有一个变量不能做到这一点，它会将赔率的对数转换为其实际值。

建议换个角度看。。。

在逻辑回归中，我们通过计算似然概率来预测一些二元类 {0 或 1}，这是实际输出 $\text{logit}(p)$ .

当然，这是假设对数赔率可以合理地用线性函数来描述——例如， $\beta_0 + \beta_1x_1 + \beta_2x_2+ \dotsm$

......这是一个很大的假设，只有在某些时候才成立。如果那些 $x_i$ 组件对对数赔率没有独立的比例影响，那么最好选择另一个统计框架。即，对数赔率由一些固定分量组成 $\beta_0$ , 并随着每个连续项递增， $\beta_i x_i$ .

简而言之， $\beta_0$ value 是该组件方法的“固定组件”，用于描述您尝试预测的任何事件/条件的对数几率。还要记住，回归最终描述的是一些条件平均值，给定一组 $x_i$ 价值观。这些都不需要 $x_i$ -值在您的数据中为 0，甚至在现实中可能。这 $\beta_0$ 简单地向上或向下移动该线性表达式，以使变量分量最准确。

也许我以稍微不同的心态说了同样的话，但我希望这会有所帮助......

其它你可能感兴趣的问题

上一篇为什么 GLM 与具有转换变量的 LM 不同下一篇R 的联合包