多重测试中 p 值的 log 10 的图的名称是什么?

机器算法验证 数据可视化 多重比较
2022-03-27 17:18:23

在零值下,p 值均匀分布在 0 和 1 之间。取许多此类 p 值的以 10 为底的对数的负数应遵循指数分布。您可以在 null 下显示它们分布的分位数,但更重要的是,记录它们会使巨大的差异非常引人注目。我不记得这样的情节的名字了:

在此处输入图像描述

## example R code
x <- replicate(100, rnorm(10), simplify=FALSE)
y <- replicate(100, rnorm(10), simplify=FALSE)

lm.sig <- function(x, y) {
  coef(summary(lm(y ~ x)))[2, 4]
}

sigs <- mapply(lm.sig, x, y)

plot(-log(sigs, base=10), type='h', xlab='Comparison Index', ylab='-log p value')
abline(h=-log(0.05, base=10), lty=2)
legend('topleft', lty=2, 'Nominal 0.05 error rate')
2个回答

遗传学家称之为“曼哈顿阴谋”。通常酒吧更厚,中间没有间隙,所以它看起来(有点)像纽约的天际线。

垂直线图通常称为“针状图”。请参阅带有 R 的图形(第 3.7.3 节)或SAS 文档

通常,针有一个共享基线,使其在概念上类似于条形图。您的代码建议基线为 0 segments(seq(sigs), 0, seq(sigs), -log(sigs, base=10)),但您的图像看起来更像以 0, 为中心的线条segments(seq(sigs), log(sigs, base=10), seq(sigs), -log(sigs, base=10))