备择假设下的 P 值分布随机小于均匀分布

机器算法验证 r 假设检验 分布 p 值
2022-03-24 05:41:40

在大学的一节课中,我们运行了这个模拟来评估替代假设下的 p 值分布随机小于均匀分布的事实。

因此,假设我们要对线性回归进行 F 检验(参数的联合无效)

n=10
p=3
beta=c(1,2,0) #beta_2=2,null hypothesis of test f is false
sim<-function(n,p)
{
x<-cbind(1,matrix(runif(n*(p-1)),ncol=p-1))
y<-x%*%beta+rnorm(n)
X<-as.data.frame(x)
anova(lm(y~1),lm(y~.,X))
#prendo il p value
pval<-anova(lm(y~1),lm(y~.,X))$'Pr(>F)'[2]
return (pval)
}

res<-replicate(100,sim(10,3))
hist(res)
plot(ecdf(res))
curve(punif,0,1,add=T,col="red")

我得到这张图

在此处输入图像描述

任何人都可以解释(也许提供一点证据)上述陈述:

备择假设下的 p 值分布随机小于均匀分布

1个回答

我假设这是一个自学问题,所以我不会给出完整的解释,而是一些提示

假设你知道

  • “随机较小”是什么意思(见维基百科
  • 并且您可以解释两个累积分布的差异,例如上图(注意红线是均匀的,也许它也有助于查看直方图)

那么答案应该很明显了。

旁注:您在课堂上进行此类模拟非常好,我认为这很有启发性。