考虑一个输出比率的实验介于 0 和 1 之间。如何获得该比率与本文无关。它在此问题的先前版本中进行了详细说明,但在讨论 meta后为了清楚起见将其删除。
重复这个实验次,而很小(大约 3-10)。这假设是独立同分布的。从这些我们通过计算平均值来估计平均值,但是如何计算相应的置信区间?
使用标准方法计算置信区间时,有时大于 1。但是,我的直觉是正确的置信区间......
- ... 应在 0 和 1 范围内
- ...应该随着增加而变小
- ...大约是使用标准方法计算的顺序
- ...通过数学上合理的方法计算
这些不是绝对的要求,但我至少想明白为什么我的直觉是错误的。
基于现有答案的计算
在下文中,将比较现有答案产生的置信区间.
标准方法(又名“学校数学”)
,,因此 99% 置信区间为. 这与直觉 1 相矛盾。
裁剪(@soakley 在评论中建议)
只需使用标准方法,然后提供结果很容易做到。但是我们可以这样做吗?我还不相信下边界保持不变(-> 4。)
逻辑回归模型(@Rose Hartman 建议)
转换数据: 导致, 将其转换回来导致. 显然,6.90 是转换数据的异常值,而 0.99 不是未转换数据的异常值,导致置信区间非常大。(--> 3.)
二项式比例置信区间(@Tim 建议)
该方法看起来相当不错,但不幸的是它不适合实验。正如@ZahavaKor 所建议的那样,只需将结果组合并将其解释为一项大型重复伯努利实验,结果如下:
在......之外总共。将其输入 Adj。沃尔德计算器给出. 这似乎不太现实,因为没有一个在那个区间内!(--> 3.)
自举(@soakley 建议)
和我们有 3125 种可能的排列。采取排列的中间均值,我们得到. 看起来还不错,尽管我希望有更大的间隔(--> 3.)。然而,它是每个构造永远不会大于. 因此,对于一个小样本,它会增长而不是收缩(--> 2.)。这至少是上面给出的示例所发生的情况。