反对二项式假设的反例

机器算法验证 自习 二项分布 假设
2022-03-19 18:14:29

问题来自大师级概率课程。

众所周知,二项分布的基本假设是存在n 个独立的伯努利试验。更具体地说,假设是:

(1) 试验次数是固定的。n

(2) 有两种且只有两种结果,分别标记为“成功”和“失败”。结果“成功”的概率在n次试验中是相同的。

(3) 试验是独立的。也就是说,一项试验的结果不会影响其他试验的结果。

我的问题是,是否有任何反例违反了这三个假设之一?特别是,是否存在假设(2)成立但(3)不成立的情况,反之亦然?

4个回答

单独打破每一个:

(1) 试验次数是固定的。n

实验继续进行,直到观察或者直到连续成功。或者直到成功次数超过失败次数 2。km

(2) 有两种且只有两种结果,分别标记为“成功”和“失败”。结果“成功”的概率在 n 次试验中是相同的。

P(success) 取自均值为的 beta 分布。或者 P(success) 在之间交替。ppApB

(3) 试验是独立的。也就是说,一项试验的结果不会影响其他试验的结果。

P(成功|上一次试验成功)= P(成功|上一次试验失败)=p1
p2

您提出了类似骨灰盒模型的具体示例,并且很容易构建第三种情况的几种形式的骨灰盒模型(如果您使用带替换的采样)-或者如果您可以使用多个骰子,则可以使用骰子.

以你从瓮中捡球为例。假设你的骨灰盒中有 M 个球,一些是黑色的,一些是红色的。您选择 N 个球(其中 N 是一个固定数字)并数出黑色的数字 B。B不是二项分布的,因为每次选到黑球的概率取决于你已经选了多少个黑球。

如果我在这里错了,请纠正我。

a) 反例仅违反假设 (1) 将是负二项式过程,其中试验次数是随机变量;几何分布中的变量也适用的情况。

b) 反例仅违反假设 (3) 将是一个超几何过程。我根据@Hong_Ooi 的评论提出了想法。尽管乍一看,假设(2)在超几何过程设置中成立并不那么明显。

例如,假设我们在骨灰盒中有 10 个球,6 个黑色和 4 个红色。假设我们从瓮中抽出 3 个球(固定试验,假设(1)成立)没有放回,我们对 3 个黑球中出现 2 个黑球的概率感兴趣。假设(2)成立的原因如下。

Pr(第一次抽奖是黑色)= 6/10

Pr(第二次抽黑)= Pr(BB) + Pr(RB) = 6/10 * 5/9 + 4/10 * 6/9 = 54/90 = 6/10

Pr(第三次抽黑)= Pr(BBB) + Pr(BRB) + Pr(RBB) + Pr(RRB) = 6/10 *5/9 *4/8 + 6/10 *4/9 *5 /8 + 4/10 *6/9 *5/8 + 4/10 * 3/9 *6/8 = 6/10

“红”球的概率也是如此。也就是说,假设(2)成立。但显然假设(3)不成立。例如,Pr(2nd draw is a black, given 1st is a black) 不等于 Pr(1st draw is a black)。因此违反了独立性假设。

这很容易,许多答案/评论使这比它需要的更复杂。

假设你正在看某人罚球。假设二得到满足,因为您可能会错过或投篮。但是假设三可能会或可能不会满足。如果一个人同时拍摄一堆镜头,他们会感到疲倦,因此他们的成功概率会随着时间的推移而下降。但是,如果我们要进行一组在不同日子发生的试验,那么它们是相互独立的。

假设我们说我们将查看 10 个镜头,或 100 个镜头,或其他任何东西。然后满足假设一。但是,如果我们说我们将查看一个小时、一年或其他任何时间发生的多少次拍摄,那么假设一个被违反,因为我们没有固定数量的试验,所以我们不能使用二项分布来提前预测我们击中至少一定百分比的可能性。(如果我通常有 50% 的机会投中任何一个球,并且我想知道我至少击中 2/3 的可能性有多大,我无法在不知道我的投篮次数的情况下进行计算'''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''()如果我只拍摄3张照片,我有比我拍摄3000张照片更好的机会)。