来自线性回归模型的 Cohen d

机器算法验证 方差分析 规模效应 安乔娃 科恩斯-d
2022-03-20 22:38:17

问题:

我有一个带有分类/二进制()和连续()变量的多元回归模型:cixi

v=α+β1x1+β2x2+...+γ1c1+γ2c2+

我对分类二进制变量感兴趣。我想计算由控制其他变量定义的两组的 Cohen D。c1c1

到目前为止我知道什么:

有一些关于如何将 F 转换为 D 的公式(例如https://www.campbellcollaboration.org/media/k2/attachments/converting_between_effect_sizes.pdf第 13 页),但它们假设一个 ANCOVA 模型,这是一个线性模型连续和一个分类变量。相关的协变量(连续变量)的 r.square v

公式为:

d=(n1+n2)(1r2)Fn1n2

这是在 compute.es R 包中也用于转换效果大小的公式,但是他们用来证明公式 Borenstein (2009) 的参考。连续数据的影响大小。在 H. Cooper, LV Hedges, & JC Valentine (Eds.), The handbook of research synthesis and meta analysis (pp. 279-293) 中也明确了 ANCOVA 模型(一个分类变量和一个连续变量。

我不确定该公式对多变量回归是否有效。

此外,我假设 r.square 将是没有感兴趣的分类变量()的整个回归。c1

最后,是如何计算 F 的问题。我假设它是 II 型方差分析,但又不是 100% 确定。

CV 上至少有两个类似的问题:我可以根据多元回归系数d,未回答,以及回归系数中的 Cohen's d?他的答案是指残差标准误差,我有理由确定这不是我的情况的正确答案。

因此我的问题:

1)该公式是否适用于多变量回归?

2) r.squared 是指没有感兴趣的分类变量的回归吗?

3) F 是使用 II 型方差分析计算的吗?

2个回答

在您的回归模型中,(0/1 指示变量的非标准化回归系数)是调整后的均值差,针对模型中的其他变量进行调整。因此,您可以作为分子,例如: 其中是系数,而是: 上面的下标是对于属于c1c1d

d=Bspooled ,
Bcispooled
spooled=s12(n11)+s22(n21)n1+n22 
ci. 挑战在于,除非您拥有原始数据(您可能拥有原始数据,但进行元分析的人可能没有),否则通常不会为复杂的回归模型报告这些值。然而,只是的总体方差减去归因于处理效果的方差(例如)。的总体标准差指标变量创建的两个组的样本大小,$s_{pooled$} 可以按如下方式计算:spooled2yciyci

spooled=sy2(N1)B2(n1n2n1+n2)N2 .

因此,如果您不进行统计论证,那么需要“坚持”什么?您是在问它在控制其他变量时可能不是,因为在其标准公式中,Cohen 的是由汇总方差的估计归一化的平均差。另一方面, /以及它们的部分版本,被明确设计为表达您正在寻找的效果大小。是一篇引用率相当高的论文,关于适用于许多常见实验设计结构的泛化。然而,本文讨论了使用成对 t 分数计算 Cohen dc1dη2ω2d同时控制协变量。