多重 R 和 R 平方有什么区别?

机器算法验证 回归 r平方
2022-02-09 16:00:16

在线性回归中,我们经常得到多个 R 和 R 平方。它们之间有什么区别?

3个回答

大写(相对于)通常应该是多元回归模型中的倍数在二元线性回归中,没有多重,并且因此,一个区别是适用性:“多个 ”意味着多个回归量,而“ ”不一定。R2r2R2RR2=r2RR2

另一个简单的区别是解释。在多元回归中,多重多重相关系数,而它的平方是决定系数可以解释为有点像双变量相关系数,主要区别在于多重相关性是因变量和预测变量的线性组合之间的关系,而不仅仅是其中的任何一个,而不仅仅是这些双变量相关性的平均值。可以解释为因变量中可由预测变量解释的方差百分比如上所述,如果只有一个预测变量,这也是正确的。RRR2

多重 R 实际上可以看作是响应和拟合值之间的相关性。因此,它总是积极的。多重 R 平方是它的平方版本。

让我用一个小例子来说明:

set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)

fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared:  0.2347

(R <- cor(y, fitted(fit))) # 0.4845068
R^2                        # 0.2347469

没有必要在“多”或不“多”上大惊小怪。此公式始终适用,即使在 Anova 设置中也是如此。在只有一个协变量与响应之间的相关性相同。XX

我简单地向我的学生解释:

  1. 倍数R被认为是相关系数的绝对值(或没有负号的相关系数)!

  2. R平方只是多个R的平方。它可以通过自变量引起的变化百分比(s)

这样很容易掌握概念和区别。