何时使用 Cohen's d 和何时使用 t 检验?

机器算法验证 统计学意义 t检验 科恩斯-d
2022-03-19 18:28:20

我何时使用Cohen's以及何时使用t-test可能还有:它们之间的(概念)区别是什么?这两个测试都是为了研究两个分布之间的差异。我只是粗略地知道,Cohen's 用于计算效应大小,而 t-test 旨在研究两个分布之间是否存在一般差异(?)。

公式:

t检验:T=x¯y¯sx2nx+sy2ny

s作为方差。

科恩的d=μ1μ2σ

我看到存在差异,但看起来也非常相似。不是吗?

图像

2个回答

Cohen 的 d 试图告诉您两个分布之间的标准化差异有多大。它在心理学等领域非常流行,我认为没有明显的单位可以用来描述差异。在医学统计数据中,我可以说(例如)您的 HbA1c 水平在两组中平均相差 5mg,并且不需要使用 Cohen 的 d。

t 检验试图告诉您有足够的证据来拒绝差异不为零的想法。但是,实际上,非零差异可能完全不相关。另外,不要忘记在使用 t 检验时必须做出技术假设,例如,您默认假设两组具有相同的方差。

有人认为比较从两个样本估计的置信区间或可信区间更有用。

这里有一篇有趣的文章:https ://bmcresnotes.biomedcentral.com/articles/10.1186/s13104-015-1020-4

T 检验与 Cohen 的检验呈互补关系d(以及使用 Cohen 的等价检验d)。

T 检验给出了一个 p 值,它是犯 I 类错误的概率。如果 p 值太小,可以拒绝原假设,但不能仅根据 p 值声明原假设为真,而不会冒犯 II 型错误的风险。

为了评估第二类错误的风险,必须进行功效检验,即计算备择假设正确的概率。但是,在测试的情况下H0:μ=0反对H1:μ0直接功率计算是不可能的。

这个问题的一个常见解决方案是假设效果的最小尺寸(这里是 Cohen 的d进来)并证明实际效果小于这个最小尺寸。这被称为“等效测试”或 TOST(两个单边测试)。这是一个有用的参考:https ://www.ncbi.nlm.nih.gov/pubmed/28736600

有替代方法,例如,基于贝叶斯因子的使用。但这些会让我们离你问题的核心太远。