多组的多重比较

机器算法验证 多重比较 事后 克鲁斯卡尔-沃利斯测试 邓恩测试
2022-03-21 20:08:46

我想确定使用多重比较测试是否适合我的数据。我使用 Kruskal-Wallis 检验来确定在平均抑制方面是否存在差异17不同的群体。分析显示存在显着差异,现在我想使用多重比较程序(也许是 Dunn 的,因为我的样本量不相等)来查看哪些组与其他组不同。

我想知道,因为我有很多组(k=17) 这是否会使多重比较测试的效力很小或不适合对该数据集执行?

1个回答

好问题!首先,让我们澄清一些潜在的混乱。邓恩检验(Dunn, 1964) 正是这样:一个检验统计量是成对t检验的非参数模拟,它将对 ANOVA 进行事后检验。它类似于 Mann-Whitney-Wilcoxon 秩和检验,不同之处在于 (1) 它采用了 Kruskal-Wallis 检验的原假设所隐含的汇总方差的度量,以及 (2) 它使用相同的排名Kruskal-Wallis 检验所使用的原始数据。

Dunn 还开发了通常被称为多重比较的Bonferroni调整 (Dunn, 1961),这是后来开发的控制全族错误率(FWER) 的众多方法之一,并且只需要除法α(单尾测试)或α/2(双尾检验)由一个人进行的成对比较的数量决定。一个人可以进行的最大成对比较次数k变量是k(k1)/2,所以这是 17*16/2=136 可能的成对比较,这意味着您可以拒绝任何单个测试的零假设,如果pα/2/136. 因此,您对这种方法的关注是有道理的。

然而,控制 FWER 的其他方法具有更强的统计能力。例如,Holm 和 Holm-Sidak 逐步方法 (Holm, 1979) 不像 Bonferroni 方法那样消耗功率。在那里,您也可以改为控制错误发现率(FDR),而这些方法——Benjamini-Hochberg (1995) 和 Benjamini-Yekutieli (2001)——通常通过假设一些无效假设错误的来提供更多的统计能力(即通过将并非所有拒绝都是错误拒绝的想法构建到顺序修改的拒绝标准中)。这些和其他多重比较调整是专门针对dunntest包中的 Stata 中的 Dunn 测试实现的(在 Stata 类型中)net describe dunntest, from(https://alexisdinno.com/stata)),以及在dunn.test包中的 R 中。

此外,还有一种替代 Dunn 检验(基于近似z检验统计量)的替代方法:Conover-Iman(仅)对被拒绝的Kruskal -Wallis 检验(基于t分布,并且是比 Dunn 的测试更有力;Conover & Iman, 1979; Convover, 1999)。也可以使用 Conover-Iman 测试控制 FWER 或 FDR 的方法,该方法在conovertest包中(在 Stata 类型中)中为 Stata 实现,在conover.testnet describe conovertest, from(https://alexisdinno.com/stata)包中为 R实现。

参考

Benjamini, Y. 和 Hochberg, Y. (1995)。控制错误发现率:一种实用且强大的多重测试方法皇家统计学会杂志B 系列(方法论),57(1):289–300。

Benjamini, Y. 和 Yekutieli, D. (2001)。依赖关系下多次测试的错误发现率控制统计年鉴,29(4):1165-1188。

康诺弗,WJ (1999)。实用非参数统计威利,新泽西州霍博肯,第 3 版。

Conover, WJ 和 Iman, RL (1979)。关于多重比较程序技术报告 LA-7677-MS,洛斯阿拉莫斯科学实验室。

邓恩,OJ (1961)。均值之间的多重比较美国统计协会杂志,56(293):52-64。

邓恩,OJ (1964)。使用秩和的多重比较技术计量学,6(3):241-252

霍尔姆,S. (1979)。一个简单的顺序拒绝多重测试程序斯堪的纳维亚统计杂志,6(65-70):1979。