经过 n 次试验后,从 0 和 1 之间的均匀分布中得出的预期 MINIMUM 值是多少?

机器算法验证 均匀分布 订单统计 极值
2022-03-17 07:00:47

假设您在 0 和 1 之间绘制一个均匀分布的随机数n次。如何计算在 n 次试验后抽取 的预期最小数量?

此外,如何计算置信区间以说明所抽取的最小数字在区间 [a,b] 中,置信度为 m%?

3个回答

您正在寻找订单统计信息次试验之后,从 0 到 1 之间的均匀分布的最小抽取分布是 beta 分布(我没有检查它的正确性,你可能应该这样做。)。具体来说,令为最小阶统计量。然后:nU(1)

U(1)B(1,n)

因此,平均值为您可以使用 beta 分布来识别使得11+nab

Prob(aU(1)b)=0.95

顺便说一句,在这种情况下使用术语置信区间是不合适的,因为您没有进行推理。

更新

计算使得并不简单。有几种可能的方法可以计算一种方法是使区间围绕平均值居中。在这种方法中,您将设置:abProb(aU(1)b)=0.95ab

a=μδ

b=μ+δ

在哪里

μ=11+n

然后,您将计算使得所需的概率为 0.95。请注意,在这种方法下,您可能无法确定高平均值周围的对称区间,但这只是我的预感。δn

正如 Srikant 建议的那样,您需要查看订单统计信息

要添加到 Srikant 的答案,您可以在 R 中轻松模拟此过程:

n = 10
N = 1000;sims = numeric(N)
for(i in 1:N)
  sims[i] = min(runif(n))

hist(sims, freq=FALSE)
x = seq(0,1,0.01)
lines(x, dbeta(x, 1, n), col=2)

要得到

替代文字 http://img441.imageshack.us/img441/6826/tmpe.jpg


稍微题外话

这个问题与我最喜欢的统计问题之一,德国坦克问题有关。这个问题是关于均匀分布的最大值,可以概括为:

假设一个人是二战期间的盟军情报分析员,一个人有一些被缴获的德国坦克的序列号。此外,假设坦克从 1 到 N 顺序编号。如何估计坦克的总数?

取自维基百科

查看维基百科页面了解更多详情。

在@Srikant 之后,可以计算 beta 分布的 CDF,并在上找到条件,使得区间包含有 95% 概率的均匀次抽取的最小值。条件是:一个有吸引力的选择是区间这也是所需属性的最小间隔。a,b[a,b]n(1a)n(1b)n=0.95[0,10.051/n]