机器算法验证 - 多组的多重比较 - 吾爱随笔录

多组的多重比较

机器算法验证多重比较事后克鲁斯卡尔-沃利斯测试邓恩测试

2022-03-21 20:08:46

我想确定使用多重比较测试是否适合我的数据。我使用 Kruskal-Wallis 检验来确定在平均抑制方面是否存在差异 $17$ 不同的群体。分析显示存在显着差异，现在我想使用多重比较程序（也许是 Dunn 的，因为我的样本量不相等）来查看哪些组与其他组不同。

我想知道，因为我有很多组（ $k = 17$ ) 这是否会使多重比较测试的效力很小或不适合对该数据集执行？

1个回答

好问题！首先，让我们澄清一些潜在的混乱。邓恩检验(Dunn, 1964) 正是这样：一个检验统计量是成对t检验的非参数模拟，它将对 ANOVA 进行事后检验。它类似于 Mann-Whitney-Wilcoxon 秩和检验，不同之处在于 (1) 它采用了 Kruskal-Wallis 检验的原假设所隐含的汇总方差的度量，以及 (2) 它使用相同的排名Kruskal-Wallis 检验所使用的原始数据。

Dunn 还开发了通常被称为多重比较的Bonferroni调整 (Dunn, 1961)，这是后来开发的控制全族错误率(FWER) 的众多方法之一，并且只需要除法 $\alpha$ （单尾测试）或 $\alpha/2$ （双尾检验）由一个人进行的成对比较的数量决定。一个人可以进行的最大成对比较次数 $k$ 变量是 $k(k-1)/2$ ，所以这是 17*16/2=136 可能的成对比较，这意味着您可以拒绝任何单个测试的零假设，如果 $p \le \alpha/2/136$ . 因此，您对这种方法的关注是有道理的。

然而，控制 FWER 的其他方法具有更强的统计能力。例如，Holm 和 Holm-Sidak 逐步方法 (Holm, 1979) 不像 Bonferroni 方法那样消耗功率。在那里，您也可以改为控制错误发现率(FDR)，而这些方法——Benjamini-Hochberg (1995) 和 Benjamini-Yekutieli (2001)——通常通过假设一些无效假设是错误的来提供更多的统计能力（即通过将并非所有拒绝都是错误拒绝的想法构建到顺序修改的拒绝标准中）。这些和其他多重比较调整是专门针对dunntest包中的 Stata 中的 Dunn 测试实现的（在 Stata 类型中）net describe dunntest, from(https://alexisdinno.com/stata))，以及在dunn.test包中的 R 中。

此外，还有一种替代 Dunn 检验（基于近似z检验统计量）的替代方法：Conover-Iman（仅）对被拒绝的Kruskal -Wallis 检验（基于t分布，并且是比 Dunn 的测试更有力；Conover & Iman, 1979; Convover, 1999)。也可以使用 Conover-Iman 测试控制 FWER 或 FDR 的方法，该方法在conovertest包中（在 Stata 类型中）中为 Stata 实现，在conover.testnet describe conovertest, from(https://alexisdinno.com/stata)包中为 R实现。

参考

Benjamini, Y. 和 Hochberg, Y. (1995)。控制错误发现率：一种实用且强大的多重测试方法。皇家统计学会杂志。B 系列（方法论），57（1）：289–300。

Benjamini, Y. 和 Yekutieli, D. (2001)。依赖关系下多次测试的错误发现率控制。统计年鉴，29（4）：1165-1188。

康诺弗，WJ (1999)。实用非参数统计。威利，新泽西州霍博肯，第 3 版。

Conover, WJ 和 Iman, RL (1979)。关于多重比较程序。技术报告 LA-7677-MS，洛斯阿拉莫斯科学实验室。

邓恩，OJ (1961)。均值之间的多重比较。美国统计协会杂志，56（293）：52-64。

邓恩，OJ (1964)。使用秩和的多重比较。技术计量学，6（3）：241-252 。

霍尔姆，S. (1979)。一个简单的顺序拒绝多重测试程序。斯堪的纳维亚统计杂志，6（65-70）：1979。

其它你可能感兴趣的问题

上一篇glmnet 使用什么偏差来比较λλ? 下一篇scikit-learn 的 RandomForestRegressor 是否可能出现负 OOB 分数？