人口 r 平方可以在假设固定分数或随机分数的情况下定义:
固定分数:样本量和预测变量的特定值保持固定。因此,是当预测变量值保持不变时,总体回归方程在结果中解释的方差比例。
随机分数:预测变量的特定值是从分布中得出的。因此,是指在预测变量值与预测变量的总体分布相对应的总体结果中解释的方差比例。
我之前曾询问过这种区别是否对. 我还普遍询问了如何计算的无偏估计 .
我可以看到,随着样本量变大,固定分数和随机分数之间的区别变得不那么重要了。但是,我正在尝试确认是否已调整旨在估计固定分数或随机分数.
问题
- 被调整 旨在估计固定分数或随机分数?
- 是否有原则解释调整 r 平方的公式如何与一种或其他形式的?
我困惑的背景
当我阅读 Yin and Fan (2001, p.206) 时,他们写道:
多元回归模型的基本假设之一是自变量的值是已知常数,并且在实验前由研究人员固定。只有因变量可以随样本自由变化。该回归模型称为固定线性回归模型。
然而,在社会和行为科学中,自变量的值很少由研究人员固定,并且也会受到随机误差的影响。因此,有人提出了第二种应用回归模型,其中允许因变量和自变量变化(Binder,1959;Park & Dudycha,1974)。该模型称为随机模型(或校正模型)。尽管从随机模型和固定模型获得的回归系数的最大似然估计在正态假设下是相同的,但它们的分布却大不相同。随机模型非常复杂,需要更多的研究才能取代常用的固定线性回归模型被接受。因此,通常采用固定模型,即使假设没有完全满足(Claudy,1978)。违反假设的固定回归模型的这种应用会导致“过度拟合”,因为从不完美的样本数据引入的随机误差往往在过程中被资本化。因此,以这种方式获得的样本多重相关系数往往会高估真实的总体多重相关性(Claudy,1978;Cohen & Cohen,1983;Cummings,1982)。
所以我不清楚上面的声明是否说调整了补偿随机模型引入的误差,或者这是否只是论文中标记随机模型存在的警告,但论文将重点关注固定模型。
参考
- 尹 P. 和范 X. (2001)。估计多元回归中的收缩:不同分析方法的比较。实验教育杂志,69(2),203-224。PDF格式