高的R2R2方正高pp- 简单线性回归的值

机器算法验证 回归 p 值 线性模型 r平方
2022-03-29 17:46:04

假设我们有简单的线性回归: y^=bx+intercept.

是否有可能具有高 p 值和高R2(或低 p 值和低R2)? 我一直在寻找这方面的例子。当线性回归有多个参数时,我看到了一些示例,其中某些参数的 p 值较低,但总体而言R2也很低,但我想知道单个参数的线性回归是否可能。

2个回答

是的,有可能。R2t统计量(用于计算 p 值)与以下关系完全相关:

|t|=R2(1R2)(n2)

因此,您可以拥有高R2具有高 p 值(低|t|) 如果你有一个小样本。

例如,采取n=3. 要让这个样本量为您提供小于 10% 的(双边)p 值,您需要一个R2大于 85%——任何低于这个值的值都会给你“不显着”的 p 值。

作为一个具体的例子,下面的模拟产生了一个R2接近 0.5,p 值为0.516.

set.seed(10)
n <- 3
x <- rnorm(n, 0, 1)
y <- 1 + x + rnorm(n, 0, 1)
summary(m1 <- lm(y ~ x))

Call:
lm(formula = y ~ x)

Residuals:
       1        2        3 
-0.36552  0.42802 -0.06251 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)   0.7756     0.4261    1.82    0.320
x             0.5065     0.5333    0.95    0.516

Residual standard error: 0.5663 on 1 degrees of freedom
Multiple R-squared:  0.4743,    Adjusted R-squared:  -0.05148 
F-statistic: 0.9021 on 1 and 1 DF,  p-value: 0.5164

对于相反的情况(低 p 值,低R2),您可以通过设置回归来轻松获得x解释力低,让n得到一个尽可能小的 p 值。

这看起来像是自学,所以我会提供一个提示:这些度量中的一个或两个(R 平方和 p 值)是否与样本量有关?