之间有什么关系R2R2和 F 检验?

机器算法验证 回归 假设检验 最小二乘 拟合优度
2022-01-20 04:29:10

我想知道两者之间是否有关系R2和 F 检验。

通常

R2=(Y^tY¯)2/T1(YtY¯)2/T1
它衡量回归中线性关系的强度。

F检验只是证明了一个假设。

之间有没有关系R2和 F 检验?

4个回答

回想一下,在回归设置中,F 统计量以下列方式表示。

F=(TSSRSS)/(p1)RSS/(np)

其中 TSS = 总平方和 RSS = 残差平方和,p是预测变量的数量(包括常数)和n是观察次数。这个统计有F自由度分布p1np.

还记得

R2=1RSSTSS=TSSRSSTSS

简单的代数会告诉你

R2=1(1+Fp1np)1

其中 F 是上面的 F 统计量。

这是 F 统计量(或 F 检验)与R2.

实际的解释是更大的R2导致 F 值很高,所以如果R2很大(这意味着线性模型很好地拟合了数据),那么相应的 F 统计量应该很大,这意味着应该有强有力的证据表明至少有一些系数是非零的。

如果所有假设都成立并且你有正确的形式R2那么通常的 F 统计量可以计算为F=R21R2×df2df1. 然后可以将该值与适当的 F 分布进行比较以进行 F 检验。这可以用基本代数推导/确认。

直觉上,我喜欢认为 F 比率的结果首先对“我可以拒绝”这个问题给出一个是 - 否的回答H0(如果比率远大于 1,或者 p 值 <α)。

然后如果我确定我可以拒绝H0,R2则表示关系的强弱。

换句话说,大的 F 比表明存在关系。高的R2然后表明这种关系有多强。

另外,快速:

R2 = F / (F + np/p-1)

例如,样本大小为 21 的 1df F 测试的 R2 = 2.53,将是:

R2 = 2.53 / (2.53+19) R2 = .1175