TL;DR:我正在寻找提出以下“用于统计显着性的眼间创伤测试”的论文。
更长的版本
提议的非正式“测试”的想法如下。假设您有观察结果和原假设,并假设有一些量可以从您的观察结果或原假设下的模拟中得出。进一步假设这个数量可以很容易地绘制出来。
例如,我们感兴趣的数量可能是回归参数估计。或者在上面的例子中,这是关于检查分布的均匀性,它可以是五个最满和五个最空箱中的计数的直方图。
现在,在原假设下模拟感兴趣的数量,比如 19 次。将图形表示安排在的网格中,包括在随机点的实际观察的表示。
您实际观察的面板是否足够突出以至于显而易见?(即,它是否“直接击中您的眼睛之间”,有时称为“眼间创伤测试”?)如果是这样,那么那里有东西。
对于额外的社交无能,与随机的陌生人搭讪,向他们展示情节并要求他们确定哪个面板“不适合”。如果 95% 的受害者正确识别出与实际观察对应的面板,我们可以非正式地说。
我在一篇论文中读到了这个提议,我相信这篇论文可以追溯到 2000 年代,由一位著名的统计学家按照 Tibshirani 或 Breiman 的顺序撰写,但无论我在我的文献数据库中挖掘多少,我都找不到原件纸。它甚至可能还没有发表(它似乎不在我从Journal of Computational and Graphical Statistics阅读的论文中)。
任何人都可以识别提出这一点的论文吗?
上图的R代码
set.seed(1)
n_items <- 5000
n_bins <- 1000
actual_distribution <- factor(sample(1:n_bins,n_items,replace=TRUE,prob=0.996^(1:n_bins)),levels=1:n_bins)
y_max <- 30 # set through trial and error
n_plots <- 20
(where_to_insert <- sample(1:n_plots,1))
opar <- par(mfrow=c(4,5),las=2,mai=c(.1,.5,.1,.1))
for ( ii in 1:n_sims ) {
if ( ii == where_to_insert ) {
sim <- actual_distribution
} else {
sim <- factor(sample(1:n_bins,n_items,replace=TRUE),levels=1:n_bins)
}
barplot(c(sort(table(sim),decreasing=TRUE)[1:5],
NA,NA,
rev(sort(table(sim),decreasing=FALSE)[1:5])),
xaxt="n",lwd=2,col="gray",ylim=c(0,y_max))
text(7.2,1,"...",cex=2,font=2)
}
par(opar)