[a] 当一项措施具有明显的潜在反应上限并且大量参与者得分达到或接近该上限时,就会出现天花板效应。尺度衰减是一个方法问题,只要以这种方式限制方差,就会出现这种问题。……例如,在衡量态度时可能会出现天花板效应,其中高分表示良好的态度,而最高的反应未能获得最积极的评价。…天花板效应问题的最佳解决方案是试点测试,这样可以及早发现问题。如果发现天花板效应,[并且]结果衡量标准是任务绩效,则可以使任务变得更加困难,以增加潜在响应的范围。1[重点补充]
似乎有很多建议和问题(和这里)处理分析数据,这些数据显示出类似于上面引用中描述的天花板效应。
我的问题可能很简单或幼稚,但是如何实际检测到数据中存在天花板效应?更具体地说,假设创建了心理测试并怀疑会导致天花板效应(仅视觉检查),然后修改测试以产生更大范围的值。如何证明修改后的测试已经从它生成的数据中消除了天花板效应?是否有测试表明数据集a存在天花板效应但数据集b没有天花板效应?
我幼稚的方法是只检查分布偏斜,如果没有偏斜,则得出没有天花板效应的结论。是不是过于简单化了?
编辑
再举一个更具体的例子,假设我开发了一种仪器来测量一些潜在的特征x,它随着年龄的增长而增加,但最终趋于平稳并在老年时开始下降。我制作了第一个版本,其范围为 1-14,进行了一些试验,发现似乎可能存在天花板效应(在 14 或接近 14 时的大量响应,最大值.. 我得出的结论是查看数据。但是为什么呢?有没有严格的方法来支持这种说法?
然后我将度量值修改为 1-20 的范围并收集更多数据。我看到趋势更符合我的预期,但我怎么知道测量范围足够大。我需要再次修改它吗?从视觉上看,它似乎没问题,但是有没有办法测试它来证实我的怀疑?
我想知道如何在数据中检测到这种天花板效应,而不仅仅是查看它。图表代表实际数据,而非理论数据。扩大仪器的范围创造了更好的数据传播,但这是否足够?我该如何测试呢?
1 Hessling, R.、Traxel, N. 和 Schmidt, T. (2004)。天花板效应。在 Michael S. Lewis-Beck、A. Bryman 和 Tim Futing Liao (Eds.),SAGE 社会科学研究方法百科全书。(第 107 页)。加利福尼亚州千橡市:Sage Publications, Inc. doi:10.4135/9781412950589.n102