我正试图围绕错误发现率及其相关的 q 值进行思考;我是这种技术的新手,但它似乎很有希望满足我的需求。
我不断遇到但似乎无法解决的一个症结如下:
据我所知,q-values 的排序可能与 p-values 的排序不同,这对我来说似乎是无稽之谈。进一步解释:
q 值是通过对 p 值进行排序并按等级调整这些 p 值来计算的。例如,在最初的 Benjamini & Hochberg 论文(控制错误发现率:一种实用且强大的多重测试方法)中,引入了一个值 q*,它是
(# tests) * p-sub-i / (rank order of p-sub-i)
Story 后来引入了一个校正因子“pi0”来校正并非所有采样测试都是空测试的事实。
使用这些计算(任一版本),然后可以“排序” q 值,并了解哪些测试相对于其他测试是显着的,同时仍然考虑多重测试比较的关键。
但是,如果 p 值彼此非常接近(经常发生),则这种排序顺序可以切换。例如,如果 p 值为 0.00505 (a) 和 0.00506 (b),则 q 值可以分别为 0.012 (a) 和 0.011 (b)。这样做的原因是,由于 p 值的指数或排名增加而导致的 q 值变化可能比 p 值本身的变化更显着。
上面显示的示例非常小,但仍然指向我不理解的理论含义:一些 p 值低于其他测试的测试可能最终得到比其他测试更高的 q 值,这意味着零假设测试是“任意”受到邻居的影响。
我在这里想念什么?