哪些描述性统计数据不是效应量?

机器算法验证 规模效应
2022-03-25 23:47:08

维基百科

效应量是对现象强度的度量或对该数量的基于样本的估计。从数据中计算出的效应量是一种描述性统计量,它传达了一种关系的估计大小,而无需说明数据中的表观关系是否反映了总体中的真实关系。

为了更好地理解它,我想知道除了图表和绘图之外,什么描述性统计数据不是效果大小。

2个回答

效果大小

  • 常见的标准化效应量通常量化关系或效应的数量或程度。最常见的效应量度量可能是 cohen's d、Pearson's r 和优势比(特别是对于二元预测变量)。
  • 不太常见的效应量测量:也就是说,您可以使用标准化和非标准化的效应量度量。任何传达关系程度且不受样本量特别污染的统计数据都可能是效应量度量。因此,Beta 系数、R 平方、协方差、组间的原始平均差等都反映了效果的程度。话虽如此,我发现一些研究人员在某种程度上盲目地应用了效果大小的测量方法,而忘记了更广泛的目标是让读者了解效果的程度。因此,他们通常没有意识到平均差或原始回归系数之类的度量在某种意义上是一种效应量度量。另一个盲目使用效应量的例子涉及使用效应量度量,它没有直观的解释,但已被一些教科书推荐。

不影响大小:

  • 大多数测试统计数据不是效果大小。例如,卡方检验、t 检验、z 检验、F 检验。随着总体效应规模的增加和样本量的增加,它们会变得更大。近年来,在许多方面都强调了效应量的整个语言,因为研究人员过于关注他们的测试统计数据有多大,而不是他们的效应量有多大。这在样本量很大的情况下尤其重要,即使很小的影响也可能具有统计意义。
  • 大多数单变量统计不是效应量。对于大多数目的,效应大小关注至少两个变量之间的关系。因此,样本均值、标准差、偏斜、峰度、最小值、最大值等不是效应量度量。
  • 与关系程度无关的统计数据不是效应量度量。例如,多元正态性检验、矩阵的特征值等通常不直接旨在量化通常意义上的效应。

更广泛的考虑

  • 缩放注意事项:统计数据作为效应大小度量的效用在很大程度上与其传达效应大小的能力有关。有时,这是通过使用熟悉的标准化效果度量(例如,cohen's d)来实现的。其他时候,仔细考虑变量的比例可以对效应的大小产生更清晰的解释。例如,假设我进行了一项关于收入水平培训计划的研究。我可以报告培训计划增加了 0.2 个标准差的收入,或者我可以说该计划增加了 3,500 美元的收入。两者都有用;两者都是效应量测度。第一个是标准化的(cohen's d),第二个是非标准化的(原始组平均差异)。
  • 估计效应大小的精度:我们经常提取效应大小测量的样本估计值(例如,cohen's d、pearson's r 等)。这种情况可能导致显着性检验与效应量测量的对比。尽管如此,目标仍然应该是以精确和公正的方式估计人口效应大小。从频率论者的角度来看,效应大小的置信区间提供了对精度的估计。从贝叶斯的角度来看,效应大小存在后验密度。在许多情况下,需要注意确保您使用的是无偏效应大小测量。

首先,效应量可以用于推论和描述。r 和 ORs 都是效果大小,当然都用于推理统计。

单变量统计通常不是效应量,尽管它们可以。例如,如果您要比较已婚男性和女性的年龄,则男性的平均年龄不是效应大小(那么均值的差异将是一个效应大小)。但是,如果您想查看某事物的均值是否为 0,则均值将是效果大小。

如果它衡量效果,那就是效果大小!