想象一下我在一家螺丝厂工作(这不是真的)。多年来,我们一直在生产一系列 5 厘米长(平均)的螺钉。我想修改生产参数以节省一些钱,然后检查我的新螺丝是否更短、更长或等长(5cm)。
所以我用我的新参数制作了一个系列,然后我收集螺丝并测量它们的长度。我计算平均值和标准偏差。使用这些信息,我计算标准误差并计算 p 值。
我如何计算这个实验中的效应大小?这里效应大小的直观含义是什么?
想象一下我在一家螺丝厂工作(这不是真的)。多年来,我们一直在生产一系列 5 厘米长(平均)的螺钉。我想修改生产参数以节省一些钱,然后检查我的新螺丝是否更短、更长或等长(5cm)。
所以我用我的新参数制作了一个系列,然后我收集螺丝并测量它们的长度。我计算平均值和标准偏差。使用这些信息,我计算标准误差并计算 p 值。
我如何计算这个实验中的效应大小?这里效应大小的直观含义是什么?
单样本 t 检验的标准效应大小是以样本标准差为单位的样本均值与空值之间的差异:
这里的解释是与标准化均值差的两个样本版本基本相同:它是您的分布平均发散的标准差数。与大多数情况下的效果大小一样,您可以将其视为从测试统计因此,通过测试统计量/值,您可以了解自己对结果的信心,但是这些将大小与混为一谈,因此从一个小的你不知道你是否有一个小的影响
重要的考虑因素是“什么衡量效果对您的目的很重要?”。
一种常见的方法是测量移位的标准差的数量,如果您试图计算出均值的变化量,这对您可能没有多大用处。毕竟,如果您正在制造螺钉,知道螺钉短 0.073 个标准偏差并没有多大用处。知道它们平均短约 0.016 毫米——这可能很重要。
但是,如果您正在处理规模有些随意的事物,那么数字本身并不是特别具有内在意义,那么 sd 的 shift 就更有意义了。如果您正在处理诸如考试成绩之类的问题,那么 3 的变化并不一定意味着什么……但是如果您知道它是标准差的一半,那可能就更重要了。