在我的一篇文章下面的评论中,Glen_b 和我正在讨论离散分布如何必然具有相关的均值和方差。
对于正态分布,这是有道理的。如果我告诉你$\bar{x}$,你不知道$s^2$是什么,如果我告诉你$s^2$,你不知道$\bar{x}是什么$是。(编辑以解决样本统计数据,而不是总体参数。)
但是对于离散的均匀分布,不是同样的逻辑适用吗?如果我估计端点的中心,我不知道比例,如果我估计比例,我不知道中心。
我的想法出了什么问题?
编辑
我做了jbowman的模拟。然后我用概率积分变换(我认为)来检查这种关系,而不受边缘分布的任何影响(copula 的隔离)。
Data.mean <- Data.var <- rep(NA,20000)
for (i in 1:20000){
Data <- sample(seq(1,10,1),100,replace=T)
Data.mean[i] <- mean(Data)
Data.var[i] <- var(Data)
}
par(mfrow=c(2,1))
plot(Data.mean,Data.var,main="Observations")
plot(ecdf(Data.mean)(Data.mean),ecdf(Data.var)(Data.var),main="'Copula'")
在 RStudio 中出现的小图像中,第二个图看起来在单位正方形上具有均匀的覆盖范围,因此是独立的。放大后,有明显的垂直带。我认为这与离散性有关,我不应该读到它。然后我尝试在$(0,10)$上进行连续均匀分布。
Data.mean <- Data.var <- rep(NA,20000)
for (i in 1:20000){
Data <- runif(100,0,10)
Data.mean[i] <- mean(Data)
Data.var[i] <- var(Data)
}
par(mfrow=c(2,1))
plot(Data.mean,Data.var)
plot(ecdf(Data.mean)(Data.mean),ecdf(Data.var)(Data.var))
这个看起来确实像它的点在单位正方形上均匀分布,所以我仍然怀疑$\bar{x}$和$s^2$是独立的。