R新手的项目分析

机器算法验证 r 相关性 心理测量学
2022-03-29 01:45:13

我正在尝试评估一个包含 20 个项目的多项选择测试。我想执行一个项目分析,例如可以在这个例子中找到。因此,对于每个问题,我想要 P 值和与总数的相关性,以及所选选项的分布。

我对那里的各种统计软件包一无所知,但我想使用 R,因为我对编程很熟悉,而且 R 是开源的。我设想的伪工作流程是:

  1. 在 excel 中准备数据并导出到 CSV

  2. 在 R 中加载数据

  3. 加载一个可以满足我需要的包

  4. 执行该包的命令

  5. 导出和报告。

我对 1 和 2 很有信心,但对 3 有问题,可能是因为我没有统计词汇来比较我在 CRAN 上浏览的包。 ltm看起来它可能是正确的包装,但我不知道。无论使用什么包,命令是什么?

附带问题:在链接的示例中,您认为 MC 和 MI 代表什么?

2个回答

我可以向您推荐至少两个允许执行这些任务的软件包:psych ( score.items) 和ltm ( descript)。CTT包似乎也可以处理 MCQ,但我没有这方面的经验更多信息可在 W Revelle 的网站The Personality Project上找到,尤其是。专用于R 心理测量学的页面,提供导入、分析和报告数据的分步说明。此外,CRAN Task View on Psychometrics包括许多其他资源。

如您的链接中所述,MC 代表“以正确答案回答该项目的人的平均原始总得分”,而 MI 代表“没有以正确答案回答该项目的人的平均总得分。”。点双列相关 (R(IT)) 也可在ltm包 ( biserial.cor) 中使用。这基本上是项目区分能力的指标(因为它是项目和总分的相关性),并且与 2-PL IRT 模型的区分参数或因子分析中的因子加载有关。

如果您真的想重现您显示的表格,我想您将不得不用自定义代码包装其中的一些代码,至少要输出相同类型的表格。我做了一个快速而肮脏的例子来重现你的桌子:

dat <- replicate(10, sample(LETTERS[1:4], 100, rep=TRUE))
dat[3,2] <- dat[67,5] <- NA
itan(dat)

         P      R    MC    MI NC OMIT  A  B  C  D
 [1,] 0.23 -0.222 2.870 2.169 23    0 23 22 32 23
 [2,] 0.32 -0.378 3.062 1.985 32    1 32 20 14 33
 [3,] 0.18 -0.197 2.889 2.207 18    0 18 33 22 27
 [4,] 0.33 -0.467 3.212 1.896 33    0 33 18 29 20
 [5,] 0.27 -0.355 3.111 2.056 27    1 27 23 23 26
 [6,] 0.17 -0.269 3.118 2.169 17    0 17 25 25 33
 [7,] 0.21 -0.260 3.000 2.152 21    0 21 24 25 30
 [8,] 0.24 -0.337 3.125 2.079 24    0 24 32 22 22
 [9,] 0.13 -0.218 3.077 2.218 13    0 13 29 33 25
[10,] 0.25 -0.379 3.200 2.040 25    0 25 25 31 19

由于这些是随机响应,双序列相关性和项目难度不是很有意义(除了检查数据是否真正随机:)。此外,值得检查可能的错误,因为我在 10' 中起草了 R 函数......

psych 包函数 alpha 产生您正在寻找的东西。

要导出它,保存对象并使用 xtable 函数生成 LaTeX 标记,然后可以通过任何 LaTeX 编辑器对其进行格式化。