在大学的一节课中,我们运行了这个模拟来评估替代假设下的 p 值分布随机小于均匀分布的事实。
因此,假设我们要对线性回归进行 F 检验(参数的联合无效)
n=10
p=3
beta=c(1,2,0) #beta_2=2,null hypothesis of test f is false
sim<-function(n,p)
{
x<-cbind(1,matrix(runif(n*(p-1)),ncol=p-1))
y<-x%*%beta+rnorm(n)
X<-as.data.frame(x)
anova(lm(y~1),lm(y~.,X))
#prendo il p value
pval<-anova(lm(y~1),lm(y~.,X))$'Pr(>F)'[2]
return (pval)
}
res<-replicate(100,sim(10,3))
hist(res)
plot(ecdf(res))
curve(punif,0,1,add=T,col="red")
我得到这张图
任何人都可以解释(也许提供一点证据)上述陈述:
备择假设下的 p 值分布随机小于均匀分布