机器算法验证 - 经过 n 次试验后，从 0 和 1 之间的均匀分布中得出的预期 MINIMUM 值是多少？ - 吾爱随笔录

经过 n 次试验后，从 0 和 1 之间的均匀分布中得出的预期 MINIMUM 值是多少？

机器算法验证均匀分布订单统计极值

2022-03-17 07:00:47

假设您在 0 和 1 之间绘制一个均匀分布的随机数n次。如何计算在 n 次试验后抽取的预期最小数量？

此外，如何计算置信区间以说明所抽取的最小数字在区间 [a,b] 中，置信度为 m%？

3个回答

您正在寻找订单统计信息。次试验之后，从 0 到 1 之间的均匀分布的最小抽取分布是 beta 分布（我没有检查它的正确性，你可能应该这样做。）。具体来说，令为最小阶统计量。然后： $n$ $U_{(1)}$

$U_{(1)} \sim B(1,n)$

因此，平均值为。您可以使用 beta 分布来识别和使得 $\frac{1}{1+n}$ $a$ $b$

$Prob(a \le U_{(1)} \le b) = 0.95$ 。

顺便说一句，在这种情况下使用术语置信区间是不合适的，因为您没有进行推理。

更新

计算和使得并不简单。有几种可能的方法可以计算和。一种方法是使区间围绕平均值居中。在这种方法中，您将设置： $a$ $b$ $Prob(a \le U_{(1)} \le b) = 0.95$ $a$ $b$

$a = \mu - \delta$ 和

$b = \mu + \delta$

在哪里

$\mu = \frac{1}{1+n}$ 。

然后，您将计算使得所需的概率为 0.95。请注意，在这种方法下，您可能无法确定高平均值周围的对称区间，但这只是我的预感。 $\delta$ $n$

正如 Srikant 建议的那样，您需要查看订单统计信息。

要添加到 Srikant 的答案，您可以在 R 中轻松模拟此过程：

n = 10
N = 1000;sims = numeric(N)
for(i in 1:N)
  sims[i] = min(runif(n))

hist(sims, freq=FALSE)
x = seq(0,1,0.01)
lines(x, dbeta(x, 1, n), col=2)

要得到

替代文字 http://img441.imageshack.us/img441/6826/tmpe.jpg

稍微题外话

这个问题与我最喜欢的统计问题之一，德国坦克问题有关。这个问题是关于均匀分布的最大值，可以概括为：

假设一个人是二战期间的盟军情报分析员，一个人有一些被缴获的德国坦克的序列号。此外，假设坦克从 1 到 N 顺序编号。如何估计坦克的总数？

取自维基百科

查看维基百科页面了解更多详情。

在@Srikant 之后，可以计算 beta 分布的 CDF，并在上找到条件，使得区间包含有 95% 概率的均匀次抽取的最小值。条件是：。一个有吸引力的选择是区间。这也是所需属性的最小间隔。 $a, b$ $[a,b]$ $n$ $(1-a)^n - (1-b)^n = 0.95$ $[0,1 - 0.05^{1/n}]$

其它你可能感兴趣的问题

上一篇如何生成用户友好的聚类分析摘要？下一篇评分函数的定义