从 t & df 理解独立样本 Cohen's d 的计算
t 计算中使用的 SD 是效果的 SD,而不是各个组的 SD。在配对情况下,用于 Cohen 的 d 和 t 的 SD 是相同的。但是在独立样本的 d 计算中使用的 SD 是各个组的合并 SD,而不是效果的理论 SD。在相关性为 0 且方差相等(独立情况)的假设下,效应的方差是单个条件方差的两倍。
试试下面的R代码来演示一下效果
x <- rnorm(1000, 0, 10)
var(x)
y <- rnorm(1000, 5, 10)
var(y)
cor(x,y)
var(x-y)
运行该示例几次。前两行获得 1000 个随机独立样本,方差为 100 (sd = 10)。您将看到,当 x 和 y 之间的相关性接近 0 时,xy 的方差(效果)趋向于 200。对于 x+y 也是如此。由于上面代码中的大样本,虚假相关性很少见,但在大样本的实际实验中,它们总是会发生(减少上面样本中的 n,它们会在那里发生)。因此,我们所做的是坚持理论并平均各组的方差(合并方差),然后将其加倍。或者,也可以将 var(x) + var(y) 相加。事实证明,这在数学上是相同的,但隐藏了等方差的假设。
为了进行比较,请尝试一些从效果计算中得出的相关数据。
m <- rnorm(1000, 2.5, 10)
x <- m - rnorm(1000, 2.5, 10)
y <- m + rnorm(1000, 2.5, 10)
var(x)
var(y)
cor(x,y)
var(x-y)
我没有费心将方差等同于上述(上面所有样本中的 sd = sqrt(50) 都可以)。这次您将看到 x 和 y 的方差均为 200。如果一切都像以前一样,这将导致 xy 的最终方差为 400。但是,因为 x 和 y 是相关的(大约 0.5),所以您会得到低得多的方差。这是配对 t 检验利用的数学特性。
这是其中的一部分,但为什么 cohen 的 d 使用不同的计算?通过配对测量设计,条件之间的相关性是效果计算的一部分。您通常只收集足够的 N 来真正衡量效果,而您并不是真正要衡量每个条件下的真实值,而只是衡量效果。未来的实验将倾向于采用类似的设计,重复测量的影响大小提供了更准确的复制可能性预测指标。类似的论点也适用于独立设计。
有些人认为,您应该始终使用各个条件的汇总方差。对此存在争论,有些人坚定地认为 d 公式应该始终相同并使用独立组版本。这确保了您何时使用和不使用重复测量设计的公共参考点。如果独立设计是可能的,我认为这个论点有一些优点。但我看到这种论点是在人们耳朵之间的差异之类的事情上提出的。这永远不可能是一个独立的组设计,将有非常高度相关的测量,因此应该总是有一个通过配对或相关效应测量计算的效应大小。