1 万分之一的概率,在 10000 次试验中恰好发生 1 次的似然 概率是多少
1/e≈0.3679,尽可能接近没有赔率。(它恰好发生 0 次的概率几乎完全相同。)
编辑:正如 Mark L Stone 非常正确地指出的那样,我认为你的问题是暗示试验是独立的,而没有确定情况确实如此。这是一个关键假设(在许多情况下可能不合理)。尽管如此,我将继续在此基础上回答,因为我仍然认为这是您的意图。
对于次试验和的概率也是如此,对于任何足够大的。n1/nn
概率(对于任何大的)看起来很像这样(显示 =10000 的情况):nn

如果一个事件的概率为 1:10,000,那么在 100,000 次试验中,它可能会发生 10 次;在 1,000,000 次试验中,它可能会出现 100 次,但它在任何给定的 1,000,000 次试验中出现任何次数的可能性也不一样,例如:98 次、99 次、101 次、96 次次、102 次等。
不完全是:99 和 100 的机会相同,但其他一切的机会都较低:

(随着您向外移动,概率会继续下降)。
具体来说,您正在处理和的二项分布。n=1000000p=1/10000
由于很大而很小,因此可以很好地用均值的泊松分布来近似。npλ=np=100
必须对多少次试验进行平均和计算才能接近统计确定性,即特定结果实际上是 1:10000,而不是 1:9999 或 1:10001
你不能确定它实际上是1/10000,因为你可以任意接近它但又不同于它。
在次试验中,预期的成功次数是和 sd。nnpnp(1−p)−−−−−−−−√≈np−−√
如果和,则预期成功次数为,sd;如果,预期的成功次数将是 ... 大约一个标准偏差 - 不足以“可靠地”区分它们。但是使用,您的距离大约为 sd,您可以更轻松地将它们区分开来;这可能与大多数人想要的一样低。在时,您可以很好地区分它们(此时 1/10000 看起来像 1/9999 或 1/10001 或任何更远的东西的机会非常小)。p=1/10000n=1012108104p=1/9999100,010,000n=4×10122n=1013
和次试验感到满意。如果您想以与排除 1/9999 相同的信心排除 1/9999.5,则需要 4 倍的试验次数。1013p=1/100001/9999
您可以看到,将比例确定为许多准确度数字(当非常小时)需要大量试验;多几倍的样本量才能获得足够准确的估计,以便您可以排除实际上是。p(1/p)3p=1/(k±1)1/k
假设在 10,000,000,000 次试验后,结果出现了 999,982 次,那么您会说下一次试验的概率是 1:9999.82 或 1:10000 还是一些涉及偏差的计算结果?..(或者我猜在只有一组 10,000 次试验后可以问同样的问题,但准确度要低得多!)
是的,可以在 10000 次试验或 1000 次或 100 次时询问。
让我们简化事情,进行 10000 次试验和 98 次成功。当然,可以将成功概率 98/10000 = 0.0098 作为点估计,但这实际上并不是基本比例,只是对其的估计。它很可能是 0.944... 或 0.997... 或任何数量的其他值。
因此,人们要做的一件事是构建一个值区间,该区间将(在某种意义上)与观察到的比例合理一致。有两种主要的统计哲学(贝叶斯统计和频率统计),在大样本中通常会产生相似的区间,但解释却截然不同。
最常见的是(频繁的)置信区间;(在同一实验的多次重复中)预期 )的间隔包括给定时间比例的参数。p
典型的贝叶斯区间将从代表您对其值的不确定性的参数的先验分布开始,并使用数据将其知识更新为后验分布,并从中获得可信区间。
置信区间被广泛使用(尽管可信区间可能更接近您对区间应该做什么的期望)。在二项式比例置信区间的情况下,就像这里一样,有多种方法,尽管在大样本中它们都给你几乎相同的区间。
对于骰子,即使是 6 x 10^9 的试验也可能不会导致六个结果中的每一个都恰好是 1 x 10^9
正确的; 你会期望(用公平的骰子)每次尝试时几乎(但不完全)获得 9.9994 亿和 10.0006 亿之间的成功。
如果实际概率是 1:10000,那么在预期偏差范围内增加试验往往会证实
它几乎总是会继续与之保持一致(以及一系列其他附近的值)。发生的事情不是你可以说它是 1/10000,而是随着样本量的增加,与你的结果一致的概率值的区间会变窄。