我想知道项目响应理论和验证性因素分析之间的核心、有意义的区别是什么。
我知道计算中存在差异(更多地关注项目与协方差;对数线性与线性)。
但是,我不知道从更高层次的角度来看这意味着什么——这是否意味着在某些情况下 IRT 比 CFA 更好?还是出于稍微不同的最终目的?
任何思考都是有用的,因为对研究文献的扫描会导致更多地描述 IRT 和 CFA,而不是对它们之间的核心差异进行任何有用的比较。
我想知道项目响应理论和验证性因素分析之间的核心、有意义的区别是什么。
我知道计算中存在差异(更多地关注项目与协方差;对数线性与线性)。
但是,我不知道从更高层次的角度来看这意味着什么——这是否意味着在某些情况下 IRT 比 CFA 更好?还是出于稍微不同的最终目的?
任何思考都是有用的,因为对研究文献的扫描会导致更多地描述 IRT 和 CFA,而不是对它们之间的核心差异进行任何有用的比较。
在某些方面你是对的,CFA 和 IRT 是从同一块布上剪下来的。但是它们在很多方面也完全不同。CFA,或更恰当的项目 CFA,是对结构方程/协方差建模框架的改编,以解释分类项目之间特定类型的协变。IRT 更直接地对分类变量关系进行建模,而无需在变量中仅使用一阶和二阶信息(它是完整的信息,因此其要求通常不那么严格)。
Item CFA 有几个好处,因为它属于 SEM 框架,因此在与其他变量的关系的多元系统中具有非常广泛的应用。另一方面,IRT 主要关注测试本身,尽管协变量也可以直接包含在测试中(例如,参见解释性 IRT 的主题)。我还发现项目建模关系在 IRT 框架中更为普遍,因为非单调、非参数或只是简单的自定义项目响应模型更容易处理,因为不必担心充分性使用多元相关矩阵。
两种框架都有其优点和缺点,但总的来说,当建模抽象/推理的级别专注于变量系统内的关系时,CFA 更加灵活,而如果测试本身(和其中的项目)是 IRT,则通常首选 IRT兴趣的焦点。
@Philchalmers 的回答很重要,如果您想从该领域的一位领导者 Muthen(Mplus 的创建者)那里获得参考,请点击此处:(已编辑以包含直接引用)
一位 MPlus 用户问:我试图为我的论文描述和说明二进制 CFA 和 IRT 之间当前的异同。Mplus 中用于分类 CFA 的默认估计方法是 WLSMV。要运行 IRT 模型,您手册中的示例建议使用 MLR 作为估计方法。当我使用 MLR 时,数据输入仍然是四色相关矩阵还是使用原始响应数据矩阵?
Bengt Muthen 回应:我认为分类变量的 CFA 和 IRT 之间没有区别。有时有人声称,但我不同意。通常使用哪个估算器可能会有所不同,但这不是必需的。MLR 使用原始数据,而不是样本四色相关矩阵。... ML(R) 方法与例如 Bock 的工作中描述的“边际 ML (MML)”方法相同。因此,使用原始数据并使用数值积分对因素进行积分。MML 与使用的“条件 ML”形成对比,例如与 Rasch 方法一起使用。
假设正态因子、概率(正态)项目-因子关系和条件独立性,ML 和 WLSMV 的假设是相同的,后者使用 tetrachorics。这是因为这些假设对应于假设分类结果背后的多元正态潜在连续潜在响应变量。所以 WLSMV 只使用一阶和二阶信息,而 ML 一直到最高阶。然而,信息的损失似乎很小。ML 不适合这些样本 tetrachorics 的模型,所以也许有人可以说 WLSMV 以不同的方式边缘化。这是估计器差异而不是模型差异的问题。
我们的网站上有一个 IRT 说明:
http://www.statmodel.com/download/MplusIRT2.pdf
但同样,ML(R) 方法与 IRT MML 中使用的方法没有什么不同。
来源: http ://www.statmodel.com/discussion/messages/9/10401.html?1347474605
我相信 Yves Rosseel 在他 2014 年研讨会的幻灯片 91-93 中简要讨论了它: http ://www.personality-project.org/r/tutorials/summerschool.14/rosseel_sem_cat.pdf
取自 Rosseel(2014,上面的链接):
全信息方法:边际最大似然
起源:IRT 模型(例如 Bock & Lieberman,1970)和 GLMM
...
与 IRT 的联系
• SEM 和 IRT 之间的理论关系已得到充分证明:
Takane, Y. 和 De Leeuw, J. (1987)。关于项目响应理论与离散变量因子分析的关系。心理测量,52, 393-408。
Kamata, A., & Bauer, DJ (2008)。关于因子分析和项目响应理论模型之间关系的注释。结构方程建模,15、136-153。
Joreskog, KG 和 Moustaki, I. (2001)。序数变量的因子分析:三种方法的比较。多元行为研究,36, 347-387。
它们什么时候相等?
• probit (normal-ogive) 与 logit:这两个指标都在实践中使用
• 二元项目的单因素 CFA 等效于 2 参数 IRT 模型(Birnbaum,1968):
在 CFA 中:... 在 IRT 中:...(见幻灯片)
• 多分类(序数)项目的单因素 CFA 等效于分级响应模型(Samejima,1969)
• 3 参数模型(带有猜测参数)没有等效的 CFA
• Rasch 模型等价于二元项目的单因素 CFA,但所有因素负载都被限制为相等(并且概率度量转换为 logit 度量)