从概率分布返回不太可能的结果

机器算法验证 可能性 术语 极值
2022-04-15 19:42:34

大数定律解决了大量随机试验的平均结果问题。是否有类似的法律处理大量试验获得不寻常结果的可能性?

例如,考虑一个平均值为 10 且标准差为 2 的正态概率分布。我正在测试一种计算方法,该方法仅在结果高于 4 时才会运行18,即偏离平均值的四个标准差,因此if满足条件的可能性非常低。因此,要测试该方法,我必须进行大量试验。正如人们可以预期随着更多试验的进行,试验的平均值会接近10一样,人们也可以预期,随着更多试验的进行,收到异常结果的概率18会增加。这种现象有术语吗?

3个回答

如果您想了解“极端”值或远离平均值的概率的一些一般结果(和一般现象),您应该研究极值理论或大偏差理论。

为了让您入门,这里有一些关于 CV 的链接: 计数数据的极值理论

极值理论和重(长)尾分布

大偏差理论练习

您有一系列试验,每次试验“成功”(模拟运行)的p

次试验中至少触发一次)这是从二项式分布的计算,但是您可以通过计算互补事件的概率(没有成功)并减去,从第一原理中计算出概率从 1。n

在您的情况下,, P(0 成功) =,所以 P(至少 1 成功) =p=3.167×105(1p)n1(1p)n

b)如果您希望将试验次数分布到第一次成功,那就是几何();它的意思是p1/p


时,您至少观察到一次成功的概率n=1/p1(1p)1/p=1(11/n)n11/e63.2%

因此,第一次成功的预期试验次数是,在这么多试验中至少有一次成功的概率约为 63.2%1/p31574

如果的某个倍数,,那么它至少有的近似概率一次成功。n1pn=k1p1exp(k)

因此,在 10000 次试验中,您有大约的机会至少开始一次模拟。1exp(10000/31574)27%

通过将泊松近似应用于二项式也可以直接看到这种近似。对于次试验,每次试验的成功概率为, P(0 次成功) =和泊松近似(与 ) 是np(n0)p0(1p)n=(1p)nλ=npexp(λ)λ0/0!=exp(np)

[这个近似值也与维基百科页面中关于几何分布的相关分布部分末尾提到的近似值有关(就在“另见”上方),它处理需要多于试验才能概率开始]a

--

关于问题的术语部分——至少一次成功的概率会随着您添加更多试验而增加,这可能被称为很多事情,但我不知道它有什么特别广泛的名称。

在多次试验后,您可以使用几何分布来推理此类事件。

是获得或更多的概率()。然后根据几何分布分布直到成功(即直到p18p=P(X>18)k18+

k(1p)k1p

然后,您可以使用该分布的分位数来估计您需要进行多少次试验才能使该事件发生在 95% 的运行中。或者,仅使用该分布的平均值()作为在罕见事件之前的平均试验次数。1p