正如 Jeremy 指出的那样,EFA、CFA 和 IRT 模型的分数通常会非常一致。在一维尺度或二阶因子模型的情况下尤其如此(因为这将使您在处理高阶因子时回到几乎相同的配置)。此外,不考虑测量误差但通常用于选择相关因素数量的 PCA 也将与这些因素分数高度相关,就像原始总和量表分数的情况一样,只要量表是真正的一维 - - 毕竟,所有项目分数的简单或加权总和都是总结潜在特征所需的全部。在多维尺度的情况下,如果有意义,您可以单独考虑每个尺度。
为了说明,这里是 Holzinger & Swineford (1939) 研究的三个分量表之一,可在lavaan
. 我选择了一个简单的相关因子模型,尽管可以构建其他几个 CFA 模型(并且同样有效)。在(斜)EFA 的情况下,我使用主轴分解来提取因子。EFA 和 CFA 模型均在所有项目(3 个分量表)上进行了估计。对于 PCA,我将计算限制在单个“视觉”子尺度上(以避免在 PCA 之后旋转)。
如下图所示(横轴为 EFA 因子得分,纵轴为 PCA 或 CFA 得分),两种情况下的相关性均高于 0.95。

当然,在 EFA 框架中构建因子得分的方法有很多,例如,参见DiStefano 等人的《理解和使用因子得分:应用研究人员的考虑》 。我几乎可以肯定我遇到过有关 EFA 和 CFA 分数之间相关性的论文,但我再也无法接触到它了。
“尝试两者并选择效果最好的那个并不奇怪”——真正有问题的是在不测试独立样本的相关性的情况下强制一个因子结构,这只是利用机会,IMO:我只想如果因子结构已经定义,建议使用 CFA 因子分数,或者如果兴趣只是减少特征,则使用 EFA 分数(就像在回归上下文中使用 PCR 中的 PCA 分数一样)。EFA 和 CFA 之间的差异经常被夸大,因为这两种方法都是有用的,即使在探索性方法中也是如此(CFA 具有模型拟合指数,这可能有帮助,也可能没有帮助)。