在使用 IRT 将跨研究的量表等同时,非锚项目的作用是什么?

机器算法验证 心理测量学 项目反应理论 测试等价
2022-04-05 06:57:03

我正在尝试使用 IRT 将 5 个数据集的比例相等。其中三个使用相同的比例(A);其他的使用不同的(B和C) A和C,A和B之间有重叠的项目,但B和C之间没有重叠。

  1. 是否仍然可以跨三个数据集创建相应的度量?
  2. 如果我想为 A 和 B 创建一个相称的度量,我知道我需要使用锚项……但是非锚项的作用到底是什么?(每个数据集都是唯一的)?他们添加任何信息吗?
1个回答
  1. 如果所有三种形式的共同项目不包含响应偏差(即 DIF),则完全有可能将测试表等同起来。所需要的只是估计一个多组 IRT 模型,该模型对所有测试版本中的各个锚项目具有相等约束(对于没有响应各个项目的数据集,可能存在较大的缺失数据块,但这不是统计问题),以及自由估计焦点组中潜在特征的尺度参数。同样,如果表格中有足够数量的共同项目,则可以在更多可疑项目中测试 DIF,但需要更多信息来了解表格中有多少项目是共同的。

  2. 是的,非锚项目为等值过程增加了信息,从而提高了等值的质量。您可以将非锚项目视为将测量精度添加到每个个体的各自潜在特征估计中,这反过来通过从模型的其他方面借用强度来帮助等化过程的准确性。