如何在多元回归中的预测变量之间拆分 r 平方?

机器算法验证 r 多重回归 r平方 重要性 方差分解
2022-01-30 22:26:16

我刚刚阅读了一篇论文,其中作者使用两个预测变量进行了多元回归。总体 r 平方值为 0.65。他们提供了一个表格,在两个预测变量之间拆分 r 平方。该表如下所示:

            rsquared beta    df pvalue
whole model     0.65   NA  2, 9  0.008
predictor 1     0.38 1.01 1, 10  0.002
predictor 2     0.27 0.65 1, 10  0.030

在这个模型中,R使用mtcars数据集运行,整体 r 平方值为 0.76。

summary(lm(mpg ~ drat + wt, mtcars))

Call:
lm(formula = mpg ~ drat + wt, data = mtcars)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.4159 -2.0452  0.0136  1.7704  6.7466 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   30.290      7.318   4.139 0.000274 ***
drat           1.442      1.459   0.989 0.330854    
wt            -4.783      0.797  -6.001 1.59e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.047 on 29 degrees of freedom
Multiple R-squared:  0.7609,    Adjusted R-squared:  0.7444 
F-statistic: 46.14 on 2 and 29 DF,  p-value: 9.761e-10

如何在两个预测变量之间拆分 r 平方值?

3个回答

除了约翰的回答,您可能希望获得每个预测变量的平方半偏相关

  • 不相关预测变量:如果预测变量是正交的(即不相关),则平方半偏相关将与平方零阶相关相同。
  • 相关预测变量:如果预测变量是相关的,则平方半偏相关将代表给定预测变量解释的唯一方差。在这种情况下,平方半偏相关之和将小于R2. 这个剩余的解释方差将表示由多个变量解释的方差。

如果您正在寻找 R 函数,则spcor()包中ppcor有。

您可能还想考虑在多元回归中评估变量重要性的更广泛主题(例如,请参阅有关 relaimpo 包的页面)。

您可以只获得两个单独的相关性并将它们平方或运行两个单独的模型并获得 R^2。只有当预测变量是正交的时,它们才会总结。

我添加了标记您的问题。这是其标签 wiki的一部分:

一种常见的方法是在模型中逐个添加回归量,并记录增量R2随着每个回归量的添加。由于该值取决于模型中已经存在的回归量,因此需要对回归量可以进入模型的每个可能的顺序执行此操作,然后对顺序进行平均。这对于小型模型是可行的,但对于大型模型来说在计算上变得难以接受,因为可能的订单数是p!为了p预测器。

Grömping (2007, The American Statistician )在评估变量重要性的背景下对文献进行了概述和指示。