多重比较文献中“依赖”和“独立”测试的简单语言含义?

机器算法验证 多重比较 独立 直觉 错误发现率 家庭错误
2022-01-30 17:42:58

在全族错误率(FWER) 和错误发现率(FDR) 文献中,据说控制 FWER 或 FDR 的特定方法适用于相关或独立测试。例如,在 1979 年的论文“A Simple Sequentially Rejective Multiple Test Procedure”中,Holm 写道,将他的升压 Šidák 方法与他的升压 Bonferroni 控制方法进行对比:

当测试统计量是独立的时,也可以获得同样的计算简单性。

在 Benjamini 和 Hochberg (1995) 的“控制错误发现率”中,作者写道:

定理 1.对于独立检验统计量和任何假零假设配置,上述程序将 FDR 控制在q.

后来,在 2001 年,Benjamini 和 Yekutieli 写道:

1.3. 问题在实践中尝试使用 FDR 方法时,依赖测试统计比独立测试统计更频繁,上面的多端点示例就是一个很好的例子。

这些作者使用了依赖独立个体的哪些特定含义?如果它们附有简单的语言解释,我会很高兴正式定义使测试相互依赖或独立的原因。

我可以想到几种不同的可能含义,但我不太明白其中的含义,如果有的话,它们可能是:

  • “从属”是指多变量检验(即具有相同或相似预测变量的许多因变量);独立意味着单变量测试(即许多自变量,一个因变量)。

  • “依赖”是指基于配对/匹配受试者的测试(例如配对t检验、重复测量 ANOVA 等);“独立”是指未配对/独立的样本研究设计。

  • “依赖”是指一个测试被拒绝的概率与另一个测试被拒绝的概率相关,“正相关”是指这种相关性是正的;“独立”意味着拒绝概率是不相关的。

参考文献
Benjamini, Y. 和 Hochberg, Y. (1995)。控制错误发现率:一种实用且强大的多重测试方法皇家统计学会杂志。B 系列(方法论),57(1):289–300。

Benjamini, Y. 和 Yekutieli, D. (2001)。依赖关系下多次测试的错误发现率控制统计年鉴,29(4):1165-1188。

霍尔姆,S. (1979)。一个简单的顺序拒绝多重测试程序斯堪的纳维亚统计杂志,6(65-70):1979。

1个回答

“多重比较”是附加于根据多个测试的结果做出决策的一般问题的名称。著名的XKCD“绿色果冻豆”卡通片阐明了问题的本质,其中调查人员对食用果冻豆(20 种不同颜色)与痤疮之间的关联进行了假设检验。一项测试报告的 p 值小于1/20,从而得出“青豆会引起粉刺”的结论。笑话是,根据设计,p 值具有1/20机会小于1/20,所以直觉上我们会期望看到一个低的 p 值20不同的测试。

漫画没有说的是20测试基于单独的数据集或一个数据集。

使用单独的数据集,每个20结果有一个1/20成为“重要”的机会。(独立事件的)概率的基本性质意味着所有的机会20结果是“微不足道的”是(10.05)200.36. 剩下的机会10.36=0.64大到足以证实我们的直觉,即在这一大组结果中出现一个“显着”结果也就不足为奇了;没有任何原因可以有效地分配给这样的结果,除了机会的操作。

如果20结果基于公共数据集,但是,前面的计算将是错误的:它假设所有20结果在统计学上是独立的。但他们为什么不呢?方差分析提供了一个标准示例:当将两个或多个治疗组与对照组进行比较时,每次比较都涉及相同的控制结果。比较不是独立的。现在,例如,由于控制的偶然变化,可能会出现“显着”差异。这种变化可以同时改变与每一组的比较。

(ANOVA 通过其整体 F 检验来处理这个问题。这是一种“统管一切”的比较:除非首先这个 F 检验是显着的,否则我们不会相信组间比较。)

我们可以用以下框架 抽象出这种情况的本质。多重比较涉及根据 p 值做出决定(p1,p2,,pn)n不同的测试。这些 p 值是随机变量。 假设所有相应的零假设在逻辑上是一致的,那么每个假设都应该有一个均匀分布。当我们知道它们的联合分布时,我们可以构造合理的方法来组合所有n其中一个决定。否则,我们通常能做的最好的事情就是依赖近似边界(例如,这是 Bonferroni 校正的基础)。

独立随机变量的联合分布很容易计算。因此,文献将这种情况与非独立的情况区分开来。

因此,引文中“独立”的正确含义是在通常的统计意义上的独立随机变量。


请注意,得出这个结论需要一个假设:即,所有n的零假设在逻辑上是一致的。作为避免的示例,考虑使用一批单变量数据进行两次测试(x1,,xm)假设是来自未知均值的正态分布的随机样本μ. 第一个是 t 检验μ=0, 具有 p 值p1,第二个是 t 检验μ=1, 具有 p 值p2. 由于两者在逻辑上不能同时成立,因此谈论“零分布”将是有问题的(p1,p2). 在这种情况下,根本不可能有这样的事情!因此,统计独立性的概念有时甚至不能适用。