回归方程中正负β权重的解释

机器算法验证 回归 因果关系
2022-03-19 16:56:49

我通过电子邮件收到了这个基本问题:

在回归方程中,我认为如果 beta 值为正,则因变量因更多地使用自变量而增加,如果为负,因变量因自变量增加而减少 - 类似以您阅读相关性的方式?

2个回答

在解释回归系数的含义时,我发现下面的解释非常有用。假设我们有回归

Y=a+bX

假设 变化 ,变化。因为我们有线性关系XΔXYΔY

Y+ΔY=a+b(X+ΔX)

由于我们得到Y=a+bX

ΔY=bΔX.

有了这个很容易看出,如果为正,那么的正变化将导致的正变化。如果为负,则的正变化将导致的负变化。bXYbXY

注意:我将此问题视为教学问题,即提供简单的解释。

注意 2:正如@whuber 所指出的,这种解释有一个重要的假设,即该关系适用于的所有可能值。实际上,这是一个非常严格的假设,另一方面,该解释对于的小值是有效的,因为泰勒定理说可以表示为可微函数的关系(这是一个合理的假设)是局部线性。XYΔX

,即“beta”)的含义有不同的约定。在更广泛的统计文献中,beta 通常用于表示非标准化系数。然而,在心理学(也许还有其他领域)中,b 表示非标准化系数和 beta 表示标准化系数之间经常存在区别。这个答案假设上下文表明 beta 代表标准化系数:β

  • Beta 权重:正如@whuber 所提到的,“Beta 权重”按照惯例是标准化的回归系数(参见关于标准化系数的维基百科)。在这种情况下,通常用于非标准化系数,通常用于标准化系数。bβ

  • 基本解释:给定预测变量的 beta 权重是在所有其他预测变量保持不变的情况下,给定预测变量增加一个标准差,结果变量的预测差异(以标准单位表示)。

  • 多元回归的一般资源:这个问题是基本的,意味着您应该阅读一些有关多元回归的一般材料(这是 Andy Field 的基本描述)。

  • 因果关系:注意“因变量因更多地使用自变量而增加”之类的语言。这种语言具有因果关系。Beta 权重本身不足以证明因果解释的合理性。您将需要额外的证据来证明因果解释的合理性。