我有一个关于统计学家通常如何解释方差分析输出的问题。假设我有来自 R 的方差分析输出。
> summary(fitted_data)
Call:
lm(formula = V1 ~ V2)
Residuals:
Min 1Q Median 3Q Max
-2.74004 -0.33827 0.04062 0.44064 1.22737
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.11405 0.32089 6.588 1.3e-09 ***
V2 0.03883 0.01277 3.040 0.00292 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.6231 on 118 degrees of freedom
Multiple R-squared: 0.07262, Adjusted R-squared: 0.06476
F-statistic: 9.24 on 1 and 118 DF, p-value: 0.002917
> anova(fit)
Analysis of Variance Table
Response: V1
Df Sum Sq Mean Sq F value Pr(>F)
V2 1 3.588 3.5878 9.2402 0.002917 **
Residuals 118 45.818 0.3883
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
综上所述,我猜最重要的值是 Pr(>F),对吧?所以这个 Pr,小于 0.05(95% 的水平)。我应该如何“解释”这个?我是否在“关联”中解释它,即 V2 和 V1 关联(或不关联)?还是就“意义”而言?当人们说“这个价值很重要......”时,我总是觉得我无法理解。那么什么是“重要”呢?有没有更直观的解释形式?比如“我有 95% 的把握……”。
另外,Pr 值是唯一重要的信息吗?或者我也可以查看残差和输出的其余部分来“解释”结果吗?谢谢