差异。在 P 值和 F 统计中。多元线性回归

数据挖掘 回归 统计数据
2022-03-06 16:05:32

即使我们对每个预测变量都有单独的 p 值。

为什么我们需要整体 F 统计量?

我阅读了此解决方案,但不确定是否正确。有人可以解释一下吗?

资料来源:James、Witten、Hastie 和 Tibshirani 的“统计学习简介:R 中的应用”

1个回答

整体 F-stat 表示您的模型是否明显优于仅在所有响应数据汇集在一起​​的平均值处截距的朴素模型。换句话说,它测量是否R2明显优于 0。

在你的情况下,你可以关注R2并且看到 0.897 会比 0 好。F-stat 和 p-value 在R2与 0 有细微差别。

F-stat 对回归有用的另一个地方是针对比仅截距更简单的模型进行测试。事实上,回归中每个参数的 p 值等于您通过将完整模型与排除该参数的模型进行 F 检验获得的 p 值(假设典型的良好属性随之而来)在线性回归中进行参数推断)。

不检查每个参数的单个 p 值的原因是错误的发现,这是关于多次测试的常见业务。对整个方程进行一次 F 检验消除了错误发现重要参数的可能性,以换取无法确定哪些参数是重要的。