正态分布是否更接近于比例接近或远离 0.5 的二项分布?

机器算法验证 自习 二项分布 正常化
2022-03-18 09:06:14

来自在线统计手册:

在此处输入图像描述

我不明白这一点:

近似的精度取决于 N 和 π 的值。一个经验法则是,如果 Nπ 和 N(1-π) 都大于 10,则近似是好的。

假设我有一枚不公平的硬币,所以我得到正面的概率为 0.2。所以呢?我仍然可以找到分布的平均值,即 SD。接下来我可以找到 Z 分数,然后使用普通计算器。为什么返回的概率会不太准确?

2个回答

注意:跟进@whuber 的评论,我意识到我在breaks根据hist(). 使用相同的种子运行相同的模拟,现在生成了一个对称的插图。我相信这解决了这个问题。


您可能想参考 Glen_b 的这篇文章

这将是模拟的形状:

在此处输入图像描述

我跑了100,000从二项分布中提取的随机值的模拟10具有单个伯努利实验成功概率的试验0.2,0.50.8, 分别。清楚地p=0.5更接近正态分布,并且更极端的概率值导致明显偏斜的分布。

经验法则说,两者NπN(1π)应该>10. 为了π=.5这要求N>20. 但对于π=0.2(以及对于π=0.8) 它要求N>50. 所以我们看到“近似性”在很早的时候就开始了p=.5.