Hedges 的 g 和 Cohen 的 d 有什么区别?

机器算法验证 规模效应
2022-04-08 15:19:04

我一直在阅读http://www.polyu.edu.hk/mm/effectsizefaqs/effect_size_equations2.html,我能发现两者之间的唯一区别是它们的合并标准差值略有不同,但我没有了解更改这些 SD 值如何意味着提高效应大小估计的准确性。

标准差的差异如下(SDpooled是 Cohen's d 的合并 SD 和SDpooled用于 Hedges 的 g):

SDpooled=n1SD12+n2SD22n1+n22

SDpooled=(n11)SD12+(n21)SD22n1+n22

1个回答

你是对的,它们之间的区别很小而且很大N会消失。事实上,大多数人(至少以我的经验)都没有意识到这一点。科恩的d" 经常被泛型使用,很多人没有听说过 Hedges 的g,但他们使用后一个公式并用前一个名称来称呼它。不同之处在于 Cohen 对方差使用了最大似然估计量,它的偏差很小N,而 Hedges 使用Bessel 修正来估计方差。(有关此主题的更多信息,请阅读此 CV 主题:N 和 N-1 在计算总体方差方面有什么区别?)相应的公式通常称为方差的总体公式和样本公式. 回想一下,这些是:

Var(X)population=(xix¯)2N  Var(X)sample=(xix¯)2N1
作为N无限增加,这两个估计值将收敛到相同的值。但是,对于小样本,总体公式会低估方差,因为它没有考虑均值,x¯, 是从同一数据集估计的。当这些估计随后用于估计标准化平均差时,这意味着前者会高估效应大小。

因此,对于小样本,Hedges 的g提供了对标准化均值差的更好估计,但随着样本量的增加,卓越的性能会逐渐减弱。