为什么项目分析/响应理论没有得到更广泛的应用,是否有统计上的原因?例如,如果老师进行 25 个问题的多项选择测试,发现每个人都正确回答了 10 个问题,那么 10 个问题的回答率非常低(比如 10%),其余 5 个问题的回答率大约为 50% . 重新加权分数以使难题得到更多权重难道没有意义吗?
然而,在现实世界的测试中,几乎所有问题的权重都是一样的。为什么?
以下链接讨论了选择最佳问题的歧视指数和其他困难衡量标准:http: //fcit.usf.edu/assessment/selected/responsec.html
看来,计算问题区分指数的方法只是用于前瞻性的方式(例如,如果一个问题没有很好的区分,就扔掉它)。为什么不对当前人群重新加权测试?