假设您在 0 和 1 之间绘制一个均匀分布的随机数n次。如何计算在 n 次试验后抽取 的预期最小数量?
此外,如何计算置信区间以说明所抽取的最小数字在区间 [a,b] 中,置信度为 m%?
假设您在 0 和 1 之间绘制一个均匀分布的随机数n次。如何计算在 n 次试验后抽取 的预期最小数量?
此外,如何计算置信区间以说明所抽取的最小数字在区间 [a,b] 中,置信度为 m%?
您正在寻找订单统计信息。次试验之后,从 0 到 1 之间的均匀分布的最小抽取分布是 beta 分布(我没有检查它的正确性,你可能应该这样做。)。具体来说,令为最小阶统计量。然后:
因此,平均值为。您可以使用 beta 分布来识别和使得
。
顺便说一句,在这种情况下使用术语置信区间是不合适的,因为您没有进行推理。
更新
计算和使得并不简单。有几种可能的方法可以计算和。一种方法是使区间围绕平均值居中。在这种方法中,您将设置:
和
在哪里
。
然后,您将计算使得所需的概率为 0.95。请注意,在这种方法下,您可能无法确定高平均值周围的对称区间,但这只是我的预感。
正如 Srikant 建议的那样,您需要查看订单统计信息。
要添加到 Srikant 的答案,您可以在 R 中轻松模拟此过程:
n = 10
N = 1000;sims = numeric(N)
for(i in 1:N)
sims[i] = min(runif(n))
hist(sims, freq=FALSE)
x = seq(0,1,0.01)
lines(x, dbeta(x, 1, n), col=2)
要得到
替代文字 http://img441.imageshack.us/img441/6826/tmpe.jpg
稍微题外话
这个问题与我最喜欢的统计问题之一,德国坦克问题有关。这个问题是关于均匀分布的最大值,可以概括为:
假设一个人是二战期间的盟军情报分析员,一个人有一些被缴获的德国坦克的序列号。此外,假设坦克从 1 到 N 顺序编号。如何估计坦克的总数?
取自维基百科
查看维基百科页面了解更多详情。
在@Srikant 之后,可以计算 beta 分布的 CDF,并在上找到条件,使得区间包含有 95% 概率的均匀次抽取的最小值。条件是:。一个有吸引力的选择是区间。这也是所需属性的最小间隔。