错误发现率 (FDR) 的倒数

机器算法验证 错误 多重比较
2022-03-19 18:44:54

假设我们有一个集合S包含由...组成p特征和子集S+的特征是积极的。如果Q是的任何子集S,将误报率定义为特征在Q不是正面的:

FPR[Q]=1|QS+||Q|

在哪里||表示基数。如果Q是数据的函数,d,那么我们可以将错误发现率定义为预期的误报率:

FDR[Q(d)]=Ed[FPR[Q(d)]].

现在假设我有一种方法可以对S通过重要性的可能性。我会报告顶部r根据我的数据,最有可能是重要的特征,Qr(d). 形式上,我有一系列集值函数

Q1(d)Q2(d)Q3(d)Qp(d)

在哪里|Qr(d)|=r.

我想知道的是最大值r这样集合Qr错误发现率小于某个临界值,qcrit. 也就是说,我想知道值是多少

IFDRqcrit=maxr{r{1,...,d}:FDR[Qr]qcrit}

这个“反向错误发现率”函数有名称吗?如果没有,你能推荐一个比“反向错误发现率”更好的名字吗?

1个回答

您正在尝试找到给定的“拒绝区域” 。在文献中通常称为。)qcritqcritα

进一步阅读:
Storey,JD “错误发现率的直接方法” JR Statist。社会党。 (2002) www.genomine.org/papers/directfdr.pdf