机器算法验证 - 发现双重可能性事件的概率 - 吾爱随笔录

发现双重可能性事件的概率

机器算法验证可能性近似

2022-04-13 13:22:51

重复一个实验 $n$ 可能的结果 $t$ 独立时间，除了一个结果之外的所有结果都有概率 $\frac{1}{n+1}$ 另一个结果的概率是双倍的 $\frac{2}{n+1}$ ，对于概率较高的结果比任何其他结果更频繁地发生的概率，是否有一个很好的近似公式？

为了我， $n$ 通常是数百个，并且 $t$ 选择取决于 $n$ 这样最可能的结果最常发生的概率在 10% 到 99.999% 之间。

目前，我使用一个小程序来计算粗略的近似值，假设每个结果出现的频率 $t$ 试验是独立的，并使用泊松分布近似计数。我该如何改进呢？

编辑：我非常感谢对给出的两个（可能很快更多）答案的评论/投票。

编辑 2：由于这两个答案都不能说服我，但我不想让 100 分赏金消失（而且没有人投票赞成/反对这两个答案之一），我只会选择一个答案。我仍然很感激其他答案。

3个回答

按“双重结果”的出现频率划分结果。以此数字为条件，剩余结果的分布在等概率箱中是多项式的。设是同等可能的箱子中没有箱子收到超过结果的机会。因此，寻求的概率等于 $x$ $0 \le x \le t$ $t-x$ $n-1$ $p(t-x, n-1, x)$ $n-1$ $x$

\sum_{x = 0}^{t} (\binom{t}{x}) {(\frac{2}{n + 1})}^{x} {(\frac{n - 1}{n + 1})}^{t - x} p (t - x, n - 1, x) .

$\sum_{x=0}^{t} \binom{t}{x}\left(\frac{2}{n+1}\right)^x \left(\frac{n-1}{n+1}\right)^{t-x} p(t-x,n-1,x).$

在Exact Tail Probabilities and Percentiles of the Multinomial Maximum中，Anirban DasGupta 指出（在纠正印刷错误后）等于在的展开中的系数（使用他的符号）。对于此处涉及的和的值，该系数最多可以在几秒钟内计算出来（确保在执行获得 $p(n,K,x)K^n/n!$ $\lambda^n$ $\left(\sum_{j=0}^{x}\lambda^j/j!\right)^K$ $t$ $n$ $O(\lambda^{n+1})$ $K^{\text{th}}$ 力量）。（我检查了时间并通过复制 DasGupta 的表 4 更正了拼写错误，该表显示了互补概率，并将其扩展到和均为数百的值。） $1 - p(n,K,x)$ $n$ $K$

引用 Kolchin等人的定理。远大于的计算密集型情况提供了一个近似值。在精确计算和近似之间，似乎涵盖了所有可能性。 $t$ $n$

我同意一些评论，因为泊松近似在这里听起来不错（不是“粗略”的近似）。它应该是渐近精确的，并且似乎是最合理的做法，因为精确的解析解似乎很困难。

作为一种中间选择，（如果你真的需要它）我建议我首先按以下方式对泊松近似进行修正（我前段时间做过类似的事情，并且它有效）。

正如评论所建议的那样，如果我们以总和为条件，您的模型是（不是近似而是完全）泊松。那是：

令 (在这里是一个参数) 是独立泊松变量的向量，第一个具有，其他的具有。让，所以。很明显不等同于其他模型（因为我们的模型仅限于），但它是一个很好的近似值。此外，等价于我们的模型。确实，我们可以写 $X_t$ $t$ $n$ $\lambda = 2t/(n+1)$ $\lambda = t/(n+1)$ $s=\sum x$ $E(s)=t$ $X_t$ $s=t$ $X_t | s$