假设我们有简单的线性回归: .
是否有可能具有高 p 值和高(或低 p 值和低)? 我一直在寻找这方面的例子。当线性回归有多个参数时,我看到了一些示例,其中某些参数的 p 值较低,但总体而言也很低,但我想知道单个参数的线性回归是否可能。
假设我们有简单的线性回归: .
是否有可能具有高 p 值和高(或低 p 值和低)? 我一直在寻找这方面的例子。当线性回归有多个参数时,我看到了一些示例,其中某些参数的 p 值较低,但总体而言也很低,但我想知道单个参数的线性回归是否可能。
是的,有可能。这和统计量(用于计算 p 值)与以下关系完全相关:
因此,您可以拥有高具有高 p 值(低) 如果你有一个小样本。
例如,采取. 要让这个样本量为您提供小于 10% 的(双边)p 值,您需要一个大于 85%——任何低于这个值的值都会给你“不显着”的 p 值。
作为一个具体的例子,下面的模拟产生了一个接近 0.5,p 值为.
set.seed(10)
n <- 3
x <- rnorm(n, 0, 1)
y <- 1 + x + rnorm(n, 0, 1)
summary(m1 <- lm(y ~ x))
Call:
lm(formula = y ~ x)
Residuals:
1 2 3
-0.36552 0.42802 -0.06251
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.7756 0.4261 1.82 0.320
x 0.5065 0.5333 0.95 0.516
Residual standard error: 0.5663 on 1 degrees of freedom
Multiple R-squared: 0.4743, Adjusted R-squared: -0.05148
F-statistic: 0.9021 on 1 and 1 DF, p-value: 0.5164
对于相反的情况(低 p 值,低),您可以通过设置回归来轻松获得解释力低,让得到一个尽可能小的 p 值。
这看起来像是自学,所以我会提供一个提示:这些度量中的一个或两个(R 平方和 p 值)是否与样本量有关?