从 t & df 理解独立样本 Cohen's d 的计算

机器算法验证 标准差 规模效应 科恩斯-d
2022-04-10 17:59:55

似乎对于计算 Cohen 的(效应大小的估计),您应该使用均值的差异(或在一个样本情况下,从基线)除以,如果该信息可用: 但是,当您只有 -statistic 和可用的自由度(的公式是什么在单样本/配对样本的情况下,如何很直观,因为计算为均值与标准误差的差: dSD

X¯1X¯2SD
tdfddtt
t=X¯1X¯2SE=X¯1X¯2SDN
所以等于: 这就是您在在线文章中找到的内容,例如这篇 (pdf)但对于独立样本,方程式改为: 如此处所示甚至: 那么“ ”从何而来?它与合并 SD 的公式有关吗?d
d=X¯1X¯2SD=tN
d=2tdf
d=t2N
2

1个回答

t 计算中使用的 SD 是效果的 SD,而不是各个组的 SD。在配对情况下,用于 Cohen 的 d 和 t 的 SD 是相同的。但是在独立样本的 d 计算中使用的 SD 是各个组的合并 SD,而不是效果的理论 SD。在相关性为 0 且方差相等(独立情况)的假设下,效应的方差是单个条件方差的两倍。

试试下面的R代码来演示一下效果

x <- rnorm(1000, 0, 10)
var(x)
y <- rnorm(1000, 5, 10)
var(y)
cor(x,y)
var(x-y)

运行该示例几次。前两行获得 1000 个随机独立样本,方差为 100 (sd = 10)。您将看到,当 x 和 y 之间的相关性接近 0 时,xy 的方差(效果)趋向于 200。对于 x+y 也是如此。由于上面代码中的大样本,虚假相关性很少见,但在大样本的实际实验中,它们总是会发生(减少上面样本中的 n,它们会在那里发生)。因此,我们所做的是坚持理论并平均各组的方差(合并方差),然后将其加倍。或者,也可以将 var(x) + var(y) 相加。事实证明,这在数学上是相同的,但隐藏了等方差的假设。

为了进行比较,请尝试一些从效果计算中得出的相关数据。

m <- rnorm(1000, 2.5, 10)
x <- m - rnorm(1000, 2.5, 10)
y <- m + rnorm(1000, 2.5, 10)
var(x)
var(y)
cor(x,y)
var(x-y)

我没有费心将方差等同于上述(上面所有样本中的 sd = sqrt(50) 都可以)。这次您将看到 x 和 y 的方差均为 200。如果一切都像以前一样,这将导致 xy 的最终方差为 400。但是,因为 x 和 y 是相关的(大约 0.5),所以您会得到低得多的方差。这是配对 t 检验利用的数学特性。

这是其中的一部分,但为什么 cohen 的 d 使用不同的计算?通过配对测量设计,条件之间的相关性是效果计算的一部分。您通常只收集足够的 N 来真正衡量效果,而您并不是真正要衡量每个条件下的真实值,而只是衡量效果。未来的实验将倾向于采用类似的设计,重复测量的影响大小提供了更准确的复制可能性预测指标。类似的论点也适用于独立设计。

有些人认为,您应该始终使用各个条件的汇总方差。对此存在争论,有些人坚定地认为 d 公式应该始终相同并使用独立组版本。这确保了您何时使用和不使用重复测量设计的公共参考点。如果独立设计是可能的,我认为这个论点有一些优点。但我看到这种论点是在人们耳朵之间的差异之类的事情上提出的。这永远不可能是一个独立的组设计,将有非常高度相关的测量,因此应该总是有一个通过配对或相关效应测量计算的效应大小。