样本比例标准差的标准误

机器算法验证 分布 二项分布 标准差
2022-03-28 07:59:19

我最近开始阅读 Gelman 和 Hill 的“使用回归和多级/分层模型的数据分析”,问题基于:

该样本包含 6 个关于比例的观察结果:p1,p2,,p6

每个pi有意思πi和方差πi(1πi)ni, 在哪里ni是用于计算比例的观察数pi.

检验统计量为Ti=这些比例的样本标准差。

书上说,六个比例的样本方差的期望值,p1,p2,,p6, 是(1/6)i=16πi(1πi)/ni. 我明白这一切。

我想知道的是分布Ti及其方差?如果有人可以让我知道它是什么,或者指导我阅读包含此信息的书籍或文章,我将不胜感激。

万分感谢。

1个回答

比例的准确分布是pi ~ Bin(ni,πi)/ni, 并且比例可以取值pi=0,1ni,2ni,...,ni1ni,1. 样本标准差的结果分布T是一个复杂的离散分布。,它可以写成最简单的形式:p(p1,p2,...,p6)

FT(t)P(Tt)=pP(t)i=16Bin(nipi|ni,πi),

其中是导致样本方差不大于的所有比例向量的集合。在一般情况下,确实没有办法简化这一点。从该分布中获得准确的概率需要您枚举在感兴趣的范围内产生样本方差的比例向量,然后对枚举范围内的二项式乘积求和。即使是中等大小的值,这也是一项繁重的计算工作。P(t){p|Tt}tn1,...,n6

现在,显然上述分布不是一个很有帮助的形式。它真正告诉你的是,你需要列举感兴趣的结果,然后对它们的概率求和。这就是为什么在这种情况下计算精确概率是不寻常的,并且更容易诉诸于样本方差分布的渐近形式。