为什么在伯努利分布中失败为 0,成功为 1?

机器算法验证 伯努利分布
2022-03-28 01:29:39

为什么我们选择这些数字而不是例如eπ实验的成功和失败?

如果我选择其他值而不是 0 和 1,逻辑是什么?它会对我的计算产生多大的影响?

2个回答

正如Mark L. Stone已经指出的那样,使用它是因为传统和方便。本来可以1+1Rademacher distribution或任何其他值一样。

但是也有其他原因导致01一个方便的选择。首先,伯努利分布随机变量的期望值为

E[X]=0×(1p)+1×p=p

...因此从分布定义中可以立即看出这一点。样本均值是最大似然估计p因为取 0 和 1 的算术平均值会导致整个样本中 1 的比例。

此外,我们可以很容易地将伯努利分布扩展到二项分布,即从单抽中的单次成功建模转变为建模k成功n平局——你可以总结一下是很有帮助的1's 来获得成功的次数。

这种编码便于计算还有很多其他原因,要了解更多信息,请参阅为什么性别通常编码为 0/1 而不是 1/2,例如?

数学方便。这是一个示例:如果您将成功案例设置为1和失败的情况是0,那么你就有了二项式变量XB(n,p),它计算成功的次数n独立的伯努利试验XiB(1,p), 和i=1,2,...,n, 可以写成

X=iXi

所以,

E[X]=iE[Xi]=np

此外,

V[X]=iV[Xi]=np(1p)