我收集了 85 人关于他们承担某些任务的能力的回答。
回答采用李克特五点量表:
5 = 非常好,4 = 好,3 = 一般,2 = 差,1 = 非常差,
平均得分为 2.8,标准差为 0.54。
我理解平均值和标准差代表什么。
我的问题是:这个标准偏差有多好(或多坏)?
换句话说,是否有任何指南可以帮助评估标准偏差。
我收集了 85 人关于他们承担某些任务的能力的回答。
回答采用李克特五点量表:
5 = 非常好,4 = 好,3 = 一般,2 = 差,1 = 非常差,
平均得分为 2.8,标准差为 0.54。
我理解平均值和标准差代表什么。
我的问题是:这个标准偏差有多好(或多坏)?
换句话说,是否有任何指南可以帮助评估标准偏差。
标准偏差不是“好”或“坏”。它们是数据分布程度的指标。有时,在评级量表中,我们希望广泛传播,因为它表明我们的问题/评级涵盖了我们正在评级的组的范围。其他时候,我们想要一个小的 sd,因为我们希望每个人都“高”。
例如,如果你在微积分课程中测试学生的数学技能,你可以通过问他们一些基本算术问题来获得非常小的 sd,例如. 但是假设您对微积分进行了更严格的分班考试(即,通过的学生将进入微积分 I,未通过的学生将先学习较低级别的课程)。考虑到相同的测试,您可能会认为麻省理工学院新生的 sd 比南波敦克州立大学的 sd 更低(平均值更高)。
所以。你测试的目的是什么?样本中有哪些人?
简短的回答,这很好,而且比我从调查数据中预期的要低一些。但可能您的业务故事更多的是平均百分比或前 2 框百分比。
对于来自社会科学研究的离散量表,实际上标准差是平均值的直接函数。特别是,我通过对许多此类研究的实证分析发现,5 分制调查的实际标准偏差是最大可能变化的 40%-60%(唉,这里没有记录)。
在最简单的水平上,考虑极端情况,假设平均值为 5.0。标准差必须为零,因为平均 5 的唯一方法是每个人都回答 5。相反,如果平均值为 1.0,则标准误差也必须为 0。因此,在给定平均值的情况下,标准偏差是精确定义的。
现在中间有更多的灰色区域。想象一下,人们可以回答 5.0 或 1.0,但介于两者之间。那么标准差是均值的精确函数:
标准差 = sqrt ( (5-mean)*(mean-1))
任何有界尺度上答案的最大标准偏差是尺度宽度的一半。这里是 sqrt((5-3)(3-1)) = sqrt(2*2)=2。
现在当然人们可以回答介于两者之间的值。从我们公司调查数据的元研究中,我发现在实践中数字量表的标准偏差是最大值的 40%-60%。具体来说
因此,对于您的数据集,我预计标准偏差为 60% x 2.0 = 1.2。你得到了 0.54,如果结果是不言自明的评级,这大约是我预期的一半。更复杂的测试组合的技能评级结果是否是平均值,因此方差会更低?
然而,真正的故事可能是相对于其他任务的能力如此之低或如此之高。报告技能之间的平均值或前 2 框百分比,并将分析重点放在这上面。
如果数据呈正态分布,您可以看到人口的位置。
2.26 - 3.34
) 的 1 个标准差范围内:1.72 - 3.88
) 的 2 个标准差范围内:它告诉你你的数字是如何“分散”的。