大约 600 名学生在一项广泛的评估中获得分数,可以假定其具有良好的信度/效度。考核满分100分,为计算机评分的多项选择题。
这 600 名学生在第二次、次要的评估中也有分数。在第二次评估中,他们被分成 11 个小组,有 11 名不同的评分者,评分者之间在评分方面的“慷慨”或缺乏程度方面存在很大程度的差异,这是不受欢迎的。这第二次评估也是满分 100 分。
学生没有被随机分配到队列中,并且有充分的理由预期队列之间的技能水平存在差异。
我的任务是确保第二个作业中的队列标记之间的差异不会对个别学生产生实质性的优势/劣势。
我的想法是让第二次评估的队列分数与第一次评估的队列分数保持一致,同时保持队列内的个体差异。我们应该假设我有充分的理由相信这两项任务的表现将是高度相关的,但这些标记的慷慨程度却有很大差异。
这是最好的方法吗?如果不是,那是什么?
如果回答者可以提供一些关于如何实施良好解决方案的实用技巧,例如在 R 或 SPSS 或 Excel 中,将不胜感激。