执行因子分析时,什么时候可以跨组折叠?

机器算法验证 因子分析 采样
2022-03-24 07:59:25

设想

  • 回答是在 20 个项目的量表上收集的,该量表旨在测量 4 个因素,每个量表有 5 个项目。
  • 参与者来自两组(第 1 组)和(第 2 组),样本量为n1=150n2=150
  • 一位研究人员想要评估量表的因子结构

我在咨询中看到的常见场景:

  • 第 1 组是一年级的心理学学生,第 2 组是从普通社区中抽取的
  • 第 1 组在一段时间内采样,第 2 组在几年后采样
  • 第 1 组是正常人群,第 2 组是临床人群

问题

  1. 在什么情况下适合跨组崩溃?
  2. 如何评估这些情况?

我最初的想法:

我自己最初的想法是这样的:

  1. 理论评估:评估以改变项目之间的均值、标准差或相关性的方式对两组进行抽样或测量的程度
  2. 实证评估:检查量表上的均值、标准差和相互关系之间的差异,也可选择其他相关变量(例如人口统计);进行两组验证性因子分析,以评估各组因子结构的一致性。

本质上,如果经验证据表明这些组是相似的,而理论评估表明它们是相似的,那么合并应该是合理的。

结论

  • 上面的方法看起来合理吗?
  • 你有替代策略吗?
  • 是否有任何参考资料提供有关这种情况下的最佳实践的建议或示例?
3个回答

似乎有两种情况需要考虑,具体取决于您的量表是否已经使用标准心理测量方法(来自经典测试或项目反应理论)进行了验证。在下文中,我将考虑第一种情况,即我假设初步研究已经证明了你的量表的结构效度和得分信度。

在这种情况下,没有正式需要应用探索性因子分析,除非您想检查每个组内的模式矩阵(但我通常这样做,只是为了确保没有项目意外突出低因子负载或交叉-加载到不同的因素上);为了能够汇集所有数据,您需要使用多组因子分析(因此,正如您所建议的那样,这是一种确认方法),这基本上相当于添加额外的参数来测试组对因子加载的影响(一阶模型)或因子相关性(二阶模型,如果这有意义的话),这将影响受访者子组之间的测量不变性。这可以使用Mplus (参见那里关于 CFA 的讨论)或Mx(例如康纳等人。, 2009),不确定Amos,因为它似乎仅限于简单的因子结构。Mx 软件经过重新设计,可在 R 环境OpenMx中工作。wiki 反应良好,因此您可以在遇到困难时提出问题。还有一个更新的包lavaan,它似乎是 SEM 很有前途的包。

也可以考虑来自 IRT 的替代模型,包括潜在回归 Rasch 模型(对于每个尺度分别参见 De Boeck 和 Wilson,2004 年)或多元混合 Rasch 模型(von Davier 和 Carstensen,2007 年)。您可以查看完全致力于 R 中的心理测量学Journal of Statistical Software的第 20 卷,以获取有关使用 R 进行 IRT 建模的更多信息。不过,您可能能够使用结构方程建模进行类似的测试。

如果两个组的因子结构证明是相等的,那么您可以汇总分数(在您的四个总和量表上)并照常报告您的统计数据。但是,使用 CFA 始终是一项具有挑战性的任务,因为不拒绝 H0 并不意味着您可以检查您假设的理论模型在现实世界中是否正确,只是没有理由基于统计理由拒绝它;另一方面,拒绝 null 将导致接受替代方案,这通常未指定,除非您应用嵌套模型的顺序测试。无论如何,这是我们在跨文化环境中采用的方式,尤其是当我们想要评估给定问卷(例如,关于患者报告的结果)是否衡量它声称要做什么,无论它被管理的人群。

现在,关于两组之间的明显差异——一个来自学生群体,另一个是临床样本,稍后评估——这在很大程度上取决于你自己的考虑:这两个样本是否混合从使用的问卷的文献来看是有道理的(特别是,它应该在广泛的人群中显示出时间稳定性和适用性),您是否打算将您的发现推广到更大的人群(显然,您通过增加样本量来获得权力)。乍一看,我想说的是,您需要确保两组在被认为会影响该问卷得分的特征(例如,性别、年龄、SES、生物医学史等)方面具有可比性,这可以是使用经典统计数据进行两组比较(原始分数)。知道组效度

参考:

  1. De Boeck, P. 和 Wilson, M. (2004)。解释性项目响应模型。广义线性和非线性方法施普林格。
  2. von Davier, M. 和 Carstensen, CH (2007)。多元和混合分布 Rasch 模型施普林格。

您提到的方法似乎是合理的,但您必须考虑到您不能将整个数据集视为一个整体。因此,理论上,您应该使用任何可以考虑这些组之间差异的方法,类似于在 ANOVA 或 GLM 方法中使用“组”作为随机项。

经验评估的另一种方法是正式检查是否可以在答案上找到组的影响。为此,您可以创建具有以下列的二进制数据集:

是/否 - 项目 - 参与者 - 组

有了这个,您可以将项目用作随机项,参与者嵌套在组中,并使用例如带有 logit 链接的 glm 测试组的固定效果。如果您失去太多df,您也可以忽略参与者。

这是事实的近似值,但如果组的影响很大,我不会折叠数据集。

晚上可能有点苍蝇,但你的理论可能表明两组是否具有相同的因子结构。如果您的理论表明它们确实如此,并且没有理由怀疑该理论,我建议您可以继续并相信它们具有相同的因子结构。

您的实证评估可能是一个很好的途径,可以用来抽查理论评估是否可能共享相同的结构。但是,我不直观地理解为什么项目之间的平均差异意味着它们具有不同的潜在因素结构。在我看来,这可能只是表明一组在给定因素上的得分更高或更低。