汇总函数的置信区间

机器算法验证 r 回归 置信区间 二次型
2022-04-06 07:23:47

这是来自教科书的摘要数据

## 
## Call:
## lm(formula = mpg ~ weight, data = automobile)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -12.012  -2.801  -0.351   2.114  16.480 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 46.3173644  0.7952452   58.24   <2e-16 ***
## weight      -0.0076766  0.0002575  -29.81   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.345 on 396 degrees of freedom
## Multiple R-squared:  0.6918, Adjusted R-squared:  0.691 
## F-statistic: 888.9 on 1 and 396 DF,  p-value: < 2.2e-16

然后作者接着说

正如我们上周学习如何计算的那样,β1 的 95% 置信区间也将验证此 SLR 模型中权重的线性表示的强度

现在,这是另一个数据(二次方程)

## 
## Call:
## lm(formula = mpg ~ weight + I(weight^2), data = automobile)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -12.6643  -2.7111  -0.3293   1.8185  16.0863 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  6.252e+01  2.971e+00  21.042  < 2e-16 ***
## weight      -1.864e-02  1.959e-03  -9.517  < 2e-16 ***
## I(weight^2)  1.716e-06  3.042e-07   5.643 3.19e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.185 on 395 degrees of freedom
## Multiple R-squared:  0.7148, Adjusted R-squared:  0.7133 
## F-statistic:   495 on 2 and 395 DF,  p-value: < 2.2e-16

作者在这里说

我们可以在这里说,通过查看汇总输出,我们可以猜测 β2 的置信区间(例如 95%)不会覆盖 0,这表明权重的二次项适合添加到模型中。

有人能解释一下这个摘要数据作者是如何解释这个的吗?

1个回答

p 值用于检验估计值等于 0 的原假设。它的字面意思是观察这些数据(或更远离零的数据)的概率,如果这个估计的参数实际上为零。由于这个概率非常小(0.00000003),这是非常有力的证据表明参数不为零,如果我们构建了 95% 的置信区间,则它不会跨越零。如果置信区间确实跨越零,那么我们可以说零是这个估计的合理值。对于如此小的 p 值,这是不合理的。