如何结合使用因子分析、内部一致性和项目响应理论来减少项目数量?

机器算法验证 因子分析 可靠性 心理测量学 潜变量 有效性
2022-03-07 09:46:40

我正在根据经验开发问卷,我将在这个例子中使用任意数字来说明。就上下文而言,我正在开发一份心理问卷,旨在评估焦虑症患者常见的思维模式。一个项目可能看起来像“我需要反复检查烤箱,因为我不能确定它是否关闭”。

我有 20 个问题(李克特 5 分),可能由一个或两个因素组成(请注意,实际上我有接近 200 个问题,由 10 个量表组成,每个量表可能由两个因素组成)。我愿意删除大约一半的项目,在两个因素之一上留下 10 个问题。

我熟悉探索性因素分析(EFA)、内部一致性(Cronbach's alpha)和项目响应理论(IRT)中的项目特征曲线。我可以看到我将如何使用这些方法中的任何一种来确定在任何单一尺度内哪些项目是“更差”的。我很欣赏每种方法也回答了不同的问题,尽管它们可能会导致相似的结果,而且我不确定哪个“问题”最重要。

在我们开始之前,让我们确保我知道我分别用这些方法做什么。

  • 使用 EFA,我将确定因素的数量,并删除在其各自因素上负载最少(比如说 <.30)的项目,或跨因素交叉负载的项目。

  • 使用内部一致性,我会删除“如果项目被删除则 alpha”更差的项目。我可以假设我的规模中有一个因素,或者在初始 EFA 之后确定因素的数量,然后为每个因素运行我的 alpha。

  • 使用 IRT,我将删除不评估感兴趣因素的项目,以及他们的 (5 Likert) 响应选项。我会目测项目特征曲线。我基本上会在 45 度角上寻找一条线,从李克特量表上的选项 1 一直到潜在分数上的 5。我可以假设一个因素这样做,或者在初始
    EFA 之后进行以确定因素的数量,然后为每个因素运行曲线。

我不确定使用这些方法中的哪一种来最好地确定哪些项目是“最差的”。我在广义上使用最差,这样该项目会损害测量,无论是在可靠性还是有效性方面,这对我来说都同样重要。大概我可以结合使用它们,但我不确定如何。

如果我要继续我现在所知道的并尽力而为,我会做以下事情:

  1. 进行 EFA 以确定因素的数量。还要删除在其各自因素上加载不良的项目,因为我不希望加载严重的项目,无论它们在其他分析中会如何做。
  2. 执行 IRT 并删除该分析判断的不良项目(如果 EFA 中仍有任何问题)。
  3. 只需报告 Cronbach 的 Alpha,不要使用该指标作为删除项目的手段。

任何一般准则将不胜感激!

这里还列出了您或许可以回答的具体问题:

  1. 基于因子载荷删除项目和基于 Chronbach 的 alpha 删除项目之间的实际区别是什么(假设您对两个分析使用相同的因子布局)?

  2. 我应该先做什么?假设我使用一个因素进行 EFA 和 IRT,并且都确定了应该删除的不同项目,那么哪个分析应该优先?

尽管我会报告 Chronbach 的 alpha 值,但我并不打算进行所有这些分析。我觉得只做 IRT 会遗漏一些东西,同样只做 EFA。

2个回答

我没有任何引用,但这是我的建议:

Zeroth:如果可能的话,将数据分成训练集和测试集。

首先做全民教育。根据您对问题的了解,查看各种解决方案,看看哪些是有意义的。您必须在 Cronbach 的 alpha 之前执行此操作,否则您将不知道哪些项目属于哪个因素。(在所有项目上运行 alpha 可能不是一个好主意)。

接下来,运行 alpha 并删除每个因素中相关性比其他因素差得多的项目。我不会设置任意的截止值,我会寻找比其他值低得多的截止值。看看删除这些是否有意义。

最后,从 IRT 中选择具有各种“难度”级别的项目。

然后,如果可能的话,在测试集上重做这个,但不做任何探索。也就是说,看看在训练集上找到的结果在测试集上的效果如何。

您建议的所有三个标准实际上都可以在 IRT 中执行,更具体地说是多维 IRT。如果您的样本量相当大,那么对于每个子量表来说,这可能是一种一致的方法。通过这种方式,您可以获得独立建模项目的 IRT 的好处(对某些项目使用名义模型,对其他项目使用广义部分信用或评分,或者如果可能的话,甚至设置评级量表以帮助以更简洁的方式解释多头项目)。

MIRT 在概念上等同于项目级因子分析,因此对于二分项和多分项具有线性 EFA 等效关系。我不确定我是否会接受 <.3 丢弃物品的标准,因为它实际上取决于上下文和因素结构。较小的载荷/斜率不能提供关于拦截位置的尽可能多的信息,但可能仍然有用,因为它们可以提供跨级别的更广泛和更少峰值的信息功能θ. CAT 中的一些应用程序在早期也使用了这些类型的项目,因为它们在测试早期提供了更广泛的信息。

基于 Cronbach 标准删除项目与删除 IRT 中提供更好边际/经验可靠性的项目大致相同,因此如果您使用的软件支持这些统计数据,那么您可以遵循相同的策略而无需离开 IRT 范式。我更倾向于检查信息功能,但是看看删除一个项目是否会严重影响各种测量θ水平(与截距有关)。相对信息图在这里也很有用。

您可以尝试删除不符合大多数 IRT 软件的一维要求的项目,但如果它影响手头结构的理论表示,我不一定建议这样做。在经验应用中,通常最好尝试使我们的模型符合我们的理论,而不是相反。此外,这也是双因子/两层模型往往适用的地方,因为您希望包括所有可能的项目,同时以系统和理论上理想的方式考虑多维性。