机器算法验证 - 由李克特项目组成的问卷的因子分析 - 吾爱随笔录

由李克特项目组成的问卷的因子分析

机器算法验证因子分析秤心理测量学李克特心理学

2022-02-03 19:19:35

我曾经从心理测量学的角度分析项目。但现在我正在尝试分析其他类型的关于动机和其他主题的问题。这些问题都在李克特量表上。我最初的想法是使用因子分析，因为假设这些问题反映了一些潜在的维度。

但是因子分析合适吗？
是否有必要验证每个问题的维度？
对李克特项目进行因子分析有问题吗？
关于如何对李克特等分类项目进行因子分析，有什么好的论文和方法吗？

3个回答

从我目前看到的情况来看，FA 用于态度项目，因为它用于其他类型的评级量表。使用的度量标准引起的问题（即“李克特量表真的被视为数字量表吗？”是一个长期存在的争论，但如果您检查钟形响应分布，您可以将它们作为连续测量来处理，否则检查非线性 FA 模型或最佳缩放）可以由多模 IRT 模型处理，例如分级响应、评级量表或部分信用模型。后两者可用作粗略检查阈值距离，如在李克特类型项目中使用的，是响应格式 (RSM) 或特定项目 (PCM) 的特征。

关于您的第二点，例如，众所周知，态度或健康调查中的反应分布因国家而异（例如，与来自西方国家的人相比，中国人倾向于强调“极端”的反应模式，例如宋, X.-Y. (2007) 多样本结构方程模型分析与生活质量数据的应用，在潜在变量和相关模型手册中，Lee, S.-Y. (Ed.), pp 279-302, North -荷兰）。我想到了一些处理这种情况的方法：

使用对数线性模型（边际方法）来突出项目级别的严重组间不平衡（然后将系数解释为相对风险而不是几率）；
上面引用的 Song 的多样本 SEM 方法（不过，不知道他们是否在该方法上做了进一步的工作）。

现在，关键是这些方法中的大多数都集中在项目级别（天花板/地板效应、可靠性降低、项目拟合统计数据不佳等），但是当人们对人们如何偏离理想的预期感兴趣时一组观察者/受访者，我认为我们必须关注个人适合指数。

这样的 $\chi^2$ IRT 模型很容易获得统计数据，例如 INFIT 或 OUTFIT 均方，但通常它们适用于整个问卷。此外，由于项目参数的估计部分依赖于个人参数（例如，在边际似然框架中，我们假设高斯分布），离群个体的存在可能导致潜在的偏差估计和较差的模型拟合。

正如 Eid 和 Zickar (2007) 所提出的，结合潜在类别模型（以隔离受访者群体，例如那些总是回答极端类别与其他类别的人）和 IRT 模型（用于估计潜在类别中的项目参数和人员位置两组的特征）似乎是一个很好的解决方案。在他们的论文中描述了其他建模策略（例如 HYBRID 模型，另见 Holden 和 Book，2009）。

同样，展开模型可用于处理响应风格，它被定义为响应类别的一致且独立于内容的模式（例如，倾向于同意所有陈述）。在社会科学或心理学文献中，这被称为极端反应风格（ERS）。参考文献 (1-3) 可能有助于了解它的表现方式和测量方式。

以下是可能有助于在该主题上取得进展的论文的简短列表：

汉密尔顿，DL（1968 年）。与极端反应风格相关的人格属性。心理公报，69（3）：192-203。
格林利夫，EA (1992)。测量极端反应风格。舆论季刊，56(3)：328-351。
de Jong, MG, Steenkamp, J.-BEM, Fox, J.-P. 和 Baumgartner, H. (2008)。使用项目反应理论来衡量营销研究中的极端反应风格：一项全球调查。营销研究杂志，45（1）：104-115。
Morren, M.、Gelissen, J. 和 Vermunt, JK (2009)。处理跨文化研究中的极端反应风格：一种受限的潜在类别因素分析方法
摩尔，G.（2003 年）。通过潜在类因子方法诊断响应风格行为。重新审视了性别角色态度和对种族歧视的看法的社会人口相关性。质量与数量，37（3），277-302。
de Jong, MG Steenkamp JB, Fox, J.-P. 和 Baumgartner, H. (2008)。衡量营销研究中极端反应风格的项目反应理论：一项全球调查。营销研究杂志，45（1），104-115。
Javaras, KN 和 Ripley, BD (2007)。李克特态度数据的“展开”潜在变量模型。JASA，102（478）：454-463。
来自 Moustaki、Knott 和 Mavridis 的幻灯片，在潜在变量模型中检测异常值的方法
Eid, M. 和 Zickar, MJ (2007)。通过混合 Rasch 模型检测响应风格和伪造个性和组织评估。在 von Davier, M. 和 Carstensen, CH (Eds.), Multivariate and Mixture Distribution Rasch Models , pp. 255–270, Springer。
Holden, RR 和 Book, AS (2009)。使用混合 Rasch-latent 类建模来改进人格清单上伪造者的检测。人格和个体差异，47（3）：185-190。

探索性因素分析 (EFA) 适用于（从心理测量学和其他方面）通过推断（一个）未测量（即潜在）因素的共同影响来检查一个人可以在多大程度上解释多个项目之间的相关性。如果这不是您的特定意图，请考虑替代分析，例如：

一般线性建模（例如，多元回归、典型相关或 (M)AN(C)OVA）
验证性因素分析 (CFA) 或潜在性状/类别/概况分析
结构方程（SEM）/偏最小二乘建模

维度是 EFA 可以解决的第一个问题。您可以检查协方差矩阵的特征值（如通过 EFA 生成碎石图）并进行并行分析以解决测量的维度。（另请参阅William Revelle 的一些很好的建议和替代建议。）在提取有限数量的因子并在 EFA 中旋转它们之前，或者在使用 CFA、SEM 或类似。如果并行分析表明多维性，但您的一般（第一个）因素远远超过所有其他因素（即，迄今为止具有最大的特征值/解释了您的测量中的大部分方差），请考虑双因素分析^{（Gibbons & Hedeker，1992；赖斯、摩尔和哈维兰，2010 年）}。

在李克特量表评级的 EFA 和潜在因素建模中出现了许多问题。李克特量表产生有序（即分类、多分类、有序）数据，而不是连续数据。因子分析通常假设任何原始数据输入都是连续的，人们经常对 Pearson 积矩相关矩阵进行因子分析，这仅适用于连续数据。这是Reise 及其同事⁽²⁰¹⁰⁾的引述：

普通的验证性因素分析技术不适用于二分或多分数据^{（Byrne，2006）}。相反，需要特殊的估计程序^{（Wirth & Edwards，2007）}。基本上有三个选项可用于处理多项项目响应数据。第一个是计算一个多元矩阵，然后应用标准因子分析方法^{（参见 Knol & Berger，1991）}。第二种选择是使用全信息项因子分析^{（Gibbons & Hedeker，1992）}。第三是使用专门为有序数据设计的有限信息估计程序，例如具有均值和方差调整的加权最小二乘法^{（MPLUS；Muthén & Muthén，2009）}。

^{基于 Wang 和 Cunningham (2005)}对典型替代方案问题的讨论，我建议将第一种方法和第三种方法结合起来（即，在多元相关矩阵上使用对角加权最小二乘估计）：

当使用最大似然和基于 Pearson 积矩相关性对非正态序数数据进行验证性因子分析时，本研究中产生的向下参数估计值与 Olsson ⁽¹⁹⁷⁹⁾的发现一致。换句话说，观察到的序数变量中非正态性的大小是参数估计准确性的主要决定因素。

结果也支持 Babakus 等人的发现。^{（1987 年）}。当最大似然估计与验证性因子分析中的多变量相关输入矩阵一起使用时，解决方案往往会导致不可接受的卡方值，因此会导致显着的卡方值以及较差的拟合统计量。

问题仍然是研究人员是否应该使用加权最小二乘或对角加权最小二乘估计量来估计具有非正态分类数据的结构方程模型。加权最小二乘估计和对角加权最小二乘估计都没有对变量分布的性质做出假设，并且这两种方法都产生渐近有效的结果。然而，由于加权最小二乘估计是基于四阶矩的，这种方法经常导致实际问题并且对计算的要求很高。这意味着加权最小二乘估计在用于评估中等模型（即具有 10 个指标）到大样本量和小样本量到中等样本量时可能缺乏稳健性。

我不清楚加权最小二乘估计是否同样适用于 DWLS 估计；无论如何，作者建议使用该估算器。如果您还没有办法：

R ^{（R 核心团队，2012）}是免费的。2.15.2这些软件包需要旧版本（例如）：
- 包^{(Revelle, 2013)}psych包含该功能。 polychoric
  - 该fa.parallel功能可以帮助确定要提取的因素的数量。
- 该lavaan软件包^{(Rossel, 2012)}为潜在变量分析提供了 DWLS 估计。
- 该semTools包包含efaUnrotate、orthRotate和oblqRotate函数。
- 该mirt软件包^{（Chalmers，2012 年）}使用项目响应理论提供了有希望的替代方案。

我想Mplus ^{(Muthén & Muthén, 1998-2011)}也可以，但是免费的演示版不能容纳超过六个测量值，而且许可版也不便宜。如果您负担得起，那可能是值得的；人们喜欢 Mplus，Muthéns 通过他们的论坛提供的客户服务令人难以置信！

如上所述，DWLS 估计克服了正态假设违反（单变量和多变量）的问题，这是一个非常常见的问题，并且在李克特量表评级数据中几乎无处不在。但是，这不一定是一个实用的结果问题。大多数方法对小违规（严重偏向）不太敏感（参见正态性测试“基本上没用”吗？）。@chl 对这个问题的回答也针对极端反应风格的问题提出了更重要、更优秀的观点和建议；绝对是李克特量表评级和其他主观数据的问题。

^{参考资料

· Babakus, E., Ferguson, JCE, & Jöreskog, KG (1987)。验证性最大似然因子分析对违反测量尺度和分布假设的敏感性。营销研究杂志，24，222-228。

·伯恩，BM（2006 年）。使用 EQS 进行结构方程建模。新泽西州马瓦：劳伦斯·厄尔鲍姆。

· Chalmers, RP (2012)。mirt：用于 R 环境的多维项目响应理论包。统计软件杂志，48（6），1-29。取自http://www.jstatsoft.org/v48/i06/。

· Gibbons, RD, & Hedeker, DR (1992)。全信息项双因素分析。
心理测量学，57，423–436。

· Knol, DL, & Berger, MPF (1991)。因子分析与多维项目响应模型之间的实证比较。多元行为研究，26，457-477。

· Muthén, LK 和 Muthén, BO (1998-2011)。Mplus 用户指南（第 6 版）。加利福尼亚州洛杉矶：Muthén & Muthén。

· Muthén, LK 和 Muthén, BO (2009)。Mplus（4.00 版）。[电脑软件]。加利福尼亚州洛杉矶：作者。网址： http: //www.statmodel.com。

· Olsson, U. (1979)。多元相关系数的最大似然估计。心理测量学，44，443-460。

·R 核心团队。（2012）。R：统计计算的语言和环境。R 统计计算基金会，奥地利维也纳。ISBN 3-900051-07-0，网址：http ://www.R-project.org/ 。

· Reise, SP, Moore, TM, & Haviland, MG (2010)。双因子模型和旋转：探索多维数据产生单一量表分数的程度。人格评估杂志，92 (6), 544–559。取自http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/。

· Revelle, W. (2013)。心理：人格和心理研究程序。西北大学，伊利诺伊州埃文斯顿，美国。取自http://CRAN.R-project.org/package=psych。版本 = 1.3.2。

· Rosseel, Y. (2012)。lavaan：用于结构方程建模的 R 包。统计软件杂志，48（2），1-36。取自http://www.jstatsoft.org/v48/i02/。

· Wang, WC, & Cunningham, EG (2005)。一般健康问卷验证性因素分析中替代估计方法的比较。心理报告， 97，3-10。

· Wirth, RJ 和 Edwards, MC (2007)。项目因素分析：当前方法和未来方向。心理学方法，12，58-79。取自http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/。}

只是一个简短的说明，您可能希望通过因子分析而不是传统的相关/协方差矩阵来查看多变量相关性。

http://www.john-uebersax.com/stat/sem.htm

其它你可能感兴趣的问题

上一篇不平衡数据的 ROC 曲线下面积或 PR 曲线下面积？下一篇在这个独裁者博弈的例子中，你能从相关性中推断出因果关系吗？