有点奇怪的问题。今天在我四年级的生物统计学课上,我们正在讨论何时以及何时不使用多重测试校正,教授随口评论了一句。他问为什么我们不纠正自从我们开始做统计以来所做的每一个测试,因为它们都是(大部分)独立的,每次我们观察到一个结果,我们都会增加我们得出误报的可能性。事后他一笑置之,但我们为什么不这样做呢?我并不是说我们应该这样做,因为显然这很可笑,但是在校正测试方面有多远?
为简单起见,我们假设 alpha = 0.05,并假设每个测试 A、B 和 C 没有任何依赖关系,因此是独立的。如果我坐下来测试 A、B 和 C,无论是 T 测试还是其他什么,我显然必须针对多重校正进行调整,因为我取 0.95 的 3 次方,并且我有机会获得误报的天空火箭。但是,如果我在不同的日子做A、B、C,在不同的程序的背景下,并从中得出不同的结果,这和以前的情况有什么不同呢?我们还在观察这三个测试,它们仍然是独立的。
我想要达到的是我们所说的停止进行多次测试更正的逻辑边界。我们应该只为一个测试系列做,还是应该为整篇论文做,或者我们应该为我们曾经运行过的每一个测试做它?我了解如何使用多重测试校正,并使用 FDR / Bonferonni一直在工作。这个概念有点让我头晕目眩。
感谢您的时间。
编辑:在最近的问题中对此问题进行了扩展讨论。