多重插补数据的因子分析

机器算法验证 因子分析 缺失数据 多重插补 procrustes-分析
2022-03-18 11:37:55

我有一个数据集,其中包含对八个关键变量的大约 500 个观察值。有很多缺失的数据;只有大约 1/12 的观察是完整的。我在 SAS 中使用PROC MIandMIANALYZE对多重插补数据运行各种回归,这运行良好。(总共有大约200个变量,它们之间的相关性很高,有助于进行多重插补。)

但是,我还想对估算的数据进行因子分析。这在 SAS 中似乎并不容易做到,并且带来了一些有趣的挑战:

  1. 因子的符号是任意的,因此不同的插补可能会产生相反的符号;
  2. 一个插补中的因子 1 可能是另一个插补中的因子 2(尽管在这种情况下,关键变量如此之少,一个因子可能就足够了),

可能还有其他问题。

当然,我可以对每个估算的数据集进行探索性因子分析,然后我可以在一种特别的基础上对它们进行平均,但这似乎很草率。

一些谷歌搜索没有揭示任何解决方案,但是......好吧,谷歌并不总能找到所有东西。

任何帮助,想法,参考表示赞赏。我可以访问 SAS 和 R。

2个回答

因子分析或主成分分析确实可能会产生答案相互旋转或镜像版本的解决方案,因此平均个人分数不是一个好主意。几位作者已经探索了使用 Procrustes 分析来纠正旋转不确定性,因此请尝试搜索“multiple imputation”和“procrustes”。

改为进行验证性因子分析,这将有助于将载荷固定为在所有插补中具有相同的符号。EFA 的核心是探索性的,而 MI 框架是参数估计的框架。它们只是不能很好地结合在一起:MI 并不是特别适合测试或探索性分析。仅当您对数据一无所知时,EFA 才有意义,这种情况很少见:如果您设计了仪器,那么您一定对要测量的内容有所了解,并且可以用 CFA 切入要点。