使用汇总纵向数据进行探索性因素分析

机器算法验证 假设检验 重复测量 因子分析
2022-03-31 08:32:48

我正在使用带有公因子模型的探索性因子分析 (EFA) 进行分析。这个问题涉及方法论问题。任何了解 EFA 的人的见解将不胜感激。

我们使用15 个问题的调查来衡量人们的幸福感。3 个不同的时间对相同的100 名受试者进行了相同的问卷调查(在进行调查之间存在很大的时间差距,因此我们假设不存在时间依赖性[例如结转效应])。目标是使用因子分析来确定一组固定的公因子,然后计算因子得分并比较不同时间点的受试者得分。

以下是我的分析策略。这听起来合理吗?

分析策略:组合所有数据,就好像来自一个位置一样。也就是说,创建一个包含时间 1 的 100 个观测值的数据集,并附加时间点 2 的 100 个观测值。然后附加时间点 3 的 100 个观测值。这将得到一个包含总共 300 个观测值的组合数据集。

使用上述数据,使用所有 15 个变量和 300 个观测值拟合 EFA 模型并获得因子。在计算因子得分后,再次将数据视为来自 3 个不同时间点(即在三个时间点测量 100 名受试者)。使用即ANOVA分析因子得分以测试因子的因子得分是否在时间点之间发生变化。

2个回答

EFA 不是这里的主要问题,您需要仔细思考变量/问题之间相关性的含义。

你愿意承担独立性正在做所有的工作,感觉就像是通过一厢情愿来回避困难问题的一种方式。我不明白这怎么可能是合理的,即使中间有 6 个月。这意味着假设某人的“幸福感”容易发生任意变化,与个性或生活环境无关,因为这些变化要慢得多。你不能从心理变量中指望这种行为。

请注意,个人属性并不是这里唯一的麻烦。假设独立性还要求三个时间点之间的变化基本上是随机的,与任何其他可想象的变量无关,因此使比较毫无用处。

想象一下,您每六个月抽取 100 名参与者的不同随机样本。如果您认为在此期间您的度量上的总体分布可能会发生变化,那么在给定时间点收集的评分将比在其他时间收集的评分更相似,并且这些相关性将以不可预测的方式与人际差异相互作用,从而产生相关性以您描述的方式计算完全无法解释。

假设的这方面不一定是完全不合理的(例如,智力或性格不应该随着季节而改变)但您可能不愿意这样做,因为您确实计划查看时间点之间的变化。

将三个时间点作为病例数的三倍不需要假设独立性。相同地复制在单个时间点获得的测量值的三倍将基本上产生与该单个时间点的因子分析相同的因子。因此,独立性不是问题。将三个时间点呈现为三倍的案例实际上会给那些随时间演变的变量带来更大的差异,这将使潜在的演变因素更加突出。对合并重复的分析将要做的是找出通知 15 个变量的共同因素,使它们相互关联。因素对变量的贡献(权重)在所有测量时间都是相同的(即共同的)。一旦为 300 个“案例”计算了因子分数,然后可以将这些分数重新组织为 100 个案例中的每一个的三个表达场合,并提交给重复测量分析(例如,ANOVA 或 MANOVA)。如果您计划使用 Next Eigenvalue Sufficiency Test (NEST, Achim, 2017) 来确定您的分析需要多少个公因子,我建议在三个测量时间的平均值上应用 NEST,因为 NEST 需要知道正确的数字独立案件。