我一直试图围绕错误发现率 (FDR) 应该如何告知个别研究人员的结论。例如,如果您的研究动力不足,您是否应该对结果进行打折,即使它们在时显着?注意:我所说的 FDR 是在总体检查多项研究结果的背景下,而不是作为多次测试校正的方法。
做出(可能是慷慨的)假设,即测试的假设实际上是正确的,FDR 是 I 型和 II 型错误率的函数,如下所示:
理所当然的是,如果一项研究的效力不足,我们不应该相信结果,即使它们很重要,就像我们相信有充分效力的研究的结果一样。因此,正如一些统计学家所说,在某些情况下,“从长远来看”,如果我们遵循传统的指导方针,我们可能会发布许多错误的重要结果。如果一项研究的特征是持续不足的研究(例如,前十年与环境相互作用的文献),那么即使是重复的重要发现也可能令人怀疑。
应用 R 包extrafont
、ggplot2
和xkcd
,我认为这可能有用地概念化为一个透视问题:
有了这些信息,研究人员接下来应该做什么?如果我猜测我正在研究的效果的大小应该是多少(因此根据我的样本量估计),我是否应该调整我的水平直到 FDR = .05?即使我的研究动力不足并将 FDR 的考虑留给文献的消费者,我水平上发布结果?
我知道这是一个经常讨论的话题,无论是在这个网站上还是在统计文献中,但我似乎无法就这个问题找到一致的意见。
编辑:针对@amoeba 的评论,FDR 可以从标准 I 型/II 型错误率列联表中得出(请原谅它的丑陋):
| |Finding is significant |Finding is insignificant |
|:---------------------------|:----------------------|:------------------------|
|Finding is false in reality |alpha |1 - alpha |
|Finding is true in reality |1 - beta |beta |
因此,如果我们看到一个重要的发现(第 1 列),它在现实中为假的可能性是该列总和的 alpha。
但是,是的,我们可以修改 FDR 的定义以反映给定假设为真的(先验)概率,尽管研究能力仍然起作用: