对 R 平方的分析调整的评估
@ttnphns 向我推荐了 Yin and Fan (2001) 文章,该文章比较了不同的估计分析方法R2. 根据我的问题,他们区分了两种类型的估计器。他们使用以下术语:
- ρ2:平方人口多重相关系数的估计量
- ρ2c:平方人口交叉有效性系数的估计量
他们的结果总结在摘要中:
作者进行了蒙特卡洛实验,以研究用于估计的分析公式的有效性R2收缩,具有 4 个完全交叉的因素(平方总体多重相关系数、预测变量的数量、样本大小和多重共线性程度)和每个单元格中的 500 次重复。结果表明,最广泛使用的 Wherry 公式(在 SAS 和 SPSS 中)可能不是用于估计的最有效的分析公式ρ2. 相反,普拉特公式和布朗公式在估计方面优于其他分析公式ρ2和ρ2c, 分别。
因此,文章暗示普拉特公式 (p.209) 是估计ρ2:
R^2=1−(N−3)(1−R2)(N−p−1)[1+2(1−R2)N−p−2.3]
其中 N 是样本大小,p 是预测变量的数量。
R平方调整的经验估计
Kromrey 和 Hines (1995) 回顾了R2(例如,交叉验证方法)。他们表明这样的算法不适合估计ρ2. 这是有道理的,因为此类算法似乎旨在估计ρ2c. 然而,读完这篇文章后,我仍然不确定某种形式的适当修正的经验估计是否仍能比分析估计在估计中表现得更好ρ2.
参考
- Kromrey, JD, & Hines, CV (1995)。在多元回归中使用收缩的经验估计:一个谨慎。教育和心理测量,55(6),901-925。
- 尹 P. 和范 X. (2001)。估计R2多元回归中的收缩:不同分析方法的比较。实验教育杂志,69(2),203-224。PDF格式