假设我们有一个集合S包含由...组成p特征和子集S+的特征是积极的。如果Q是的任何子集S,将误报率定义为特征在Q不是正面的:
FPR[Q]=1−|Q∩S+||Q|
在哪里|⋅|表示基数。如果Q是数据的函数,d,那么我们可以将错误发现率定义为预期的误报率:
FDR[Q(d)]=Ed[FPR[Q(d)]].
现在假设我有一种方法可以对S通过重要性的可能性。我会报告顶部r根据我的数据,最有可能是重要的特征,Qr(d). 形式上,我有一系列集值函数
Q1(d)⊂Q2(d)⊂Q3(d)⊂⋯⊂Qp(d)
在哪里|Qr(d)|=r.
我想知道的是最大值r这样集合Qr错误发现率小于某个临界值,qcrit. 也就是说,我想知道值是多少
IFDRqcrit=maxr{r∈{1,...,d}:FDR[Qr]≤qcrit}
这个“反向错误发现率”函数有名称吗?如果没有,你能推荐一个比“反向错误发现率”更好的名字吗?