在一组量表上进行验证性因子分析时是否测试项目的正态性(和变换)?

机器算法验证 李克特 正态假设 确认因素
2022-03-31 11:56:27

我收到了以下的电子邮件:

我的项目涉及重新编写问卷并查看内部可靠性和 CFA 结果是否有所改善。共有 30 个项目构成 4 个分量表。每个项目总是,有时,从不评分。我听说我应该在将它们放入 CFA 之前检查每个项目是否正常分布。我发现除了 2 个项目外,所有项目都是正态分布的。然后我打算使用对数转换来转换这两个项目,但对我来说转换单个项目似乎很奇怪,尤其是当子尺度本身是正态分布的时候。我想我只是想检查一下:我是否需要每个项目都是正态分布的,如果是这样,如果我将 0-1-2 重新编码为 1-2-3 是否可以进行对数转换?

所以总而言之,问题是:

  • 进行CFA时是否需要检查个别测试项目是否呈正态分布?
  • 如果个别项目不是正态分布的,您是否应该在执行 CFA 之前对其进行转换?
1个回答

有序分类项目和正态性:

首先,有序的分类项目是离散的和块状的。特别是,三点响应量表缺乏甚至提供正态性的基本近似所需的粒度。当您在有序分类变量中有更多响应选项时,该项目更有可能逼近正态分布变量。

订购的分类项目有天花板和地板。如果平均值接近天花板或地板,则它们几乎总是倾斜,尾部指向远离地板或天花板的位置(视情况而定)。

有一个响应有序分类项目的模型,这表明潜在的连续数值变量是响应的基础。但这与检查原始变量不同。

做CFA时是否看项目的正态性: 在看典型的3、4、5点量表的自我报告量表时,我认为看正态性没有多大意义。

通常,您会发现偏斜的大小与项目偏离刻度中点的程度有关,并且会向最小或最大可能值移动。因此,我想您最偏斜的项目将是那些在 0-1-2 尺度上的项目,其平均值接近 0 或接近 2。也就是说,在某些例外情况下,人们可以将他们的反应集中在任何一个极端上(例如,参见一些受污染的亚马逊 5 星评级)。

总而言之,我认为了解人们如何使用响应量表很有用。它是否与最常见的回答一致,即围绕该项目的平均值,或者是围绕极端的分数,或者是否有其他东西指导回答。这里的目的只是建立对人们如何使用量表的理解。

在大多数心理学背景下,我发现均值反映了分布的大部分情况。我喜欢做的主要初步步骤是查看是否有任何物品受到严重的地板或天花板影响。因此,例如,如果您有一个在 0-1-2 范围内的平均值低于 0.4 或高于 1.6 的项目,您可能需要考虑该项目是否能够充分区分人。我不会自动放弃这样的项目,但我会考虑它的贡献。

非正常项目应该在CFA之前转化吗? 如前所述,这些项目无论如何都不是正态分布的。此外,有序分类项目的自然规模,防止极端异常值,并限制极端偏斜。此外,项目通常会使用其原始比例进行评分,因此最好保持原样。出于这个原因,我在执行 CFA 时倾向于不转换单个项目。

第二点通常涉及如何对有序分类项目建模。虽然您可以对单个项目进行 CFA,但还有一系列更高级且可以说更好的替代方法,旨在显式建模有序分类项目:

  • MPlus 有各种序数项目模型,项目之间有阈值
  • Amos 有一些模型用于对序数项进行建模
  • 最佳缩放 PCA
  • 多元相关性的因子分析

您可能想阅读Bowen 和 Wegmann的此演示文稿,他们在其中讨论了解决方案。