机器算法验证 - 回归方程中正负β权重的解释 - 吾爱随笔录

机器算法验证回归因果关系

2022-03-19 16:56:49

我通过电子邮件收到了这个基本问题：

在回归方程中，我认为如果 beta 值为正，则因变量因更多地使用自变量而增加，如果为负，因变量因自变量增加而减少 - 类似以您阅读相关性的方式？

2个回答

在解释回归系数的含义时，我发现下面的解释非常有用。假设我们有回归

Y = a + b X

$Y=a+bX$

假设由变化，由变化。因为我们有线性关系 $X$ $\Delta X$ $Y$ $\Delta Y$

Y + Δ Y = a + b (X + Δ X)

$Y+\Delta Y= a+ b(X+\Delta X)$

由于我们得到 $Y=a+bX$

Δ Y = b Δ X .

$\Delta Y = b \Delta X.$

有了这个很容易看出，如果为正，那么的正变化将导致的正变化。如果为负，则的正变化将导致的负变化。 $b$ $X$ $Y$ $b$ $X$ $Y$

注意：我将此问题视为教学问题，即提供简单的解释。

注意 2：正如@whuber 所指出的，这种解释有一个重要的假设，即该关系适用于和的所有可能值。实际上，这是一个非常严格的假设，另一方面，该解释对于的小值是有效的，因为泰勒定理说可以表示为可微函数的关系（这是一个合理的假设）是局部线性。 $X$ $Y$ $\Delta X$

，即“beta”）的含义有不同的约定。在更广泛的统计文献中，beta 通常用于表示非标准化系数。然而，在心理学（也许还有其他领域）中，b 表示非标准化系数和 beta 表示标准化系数之间经常存在区别。这个答案假设上下文表明 beta 代表标准化系数： $\beta$

Beta 权重：正如@whuber 所提到的，“Beta 权重”按照惯例是标准化的回归系数（参见关于标准化系数的维基百科）。在这种情况下，通常用于非标准化系数，通常用于标准化系数。 $b$ $\beta$
基本解释：给定预测变量的 beta 权重是在所有其他预测变量保持不变的情况下，给定预测变量增加一个标准差，结果变量的预测差异（以标准单位表示）。
多元回归的一般资源：这个问题是基本的，意味着您应该阅读一些有关多元回归的一般材料（这是 Andy Field 的基本描述）。
因果关系：注意“因变量因更多地使用自变量而增加”之类的语言。这种语言具有因果关系。Beta 权重本身不足以证明因果解释的合理性。您将需要额外的证据来证明因果解释的合理性。

其它你可能感兴趣的问题