为什么我们选择这些数字而不是例如和实验的成功和失败?
如果我选择其他值而不是 0 和 1,逻辑是什么?它会对我的计算产生多大的影响?
为什么我们选择这些数字而不是例如和实验的成功和失败?
如果我选择其他值而不是 0 和 1,逻辑是什么?它会对我的计算产生多大的影响?
正如Mark L. Stone已经指出的那样,使用它是因为传统和方便。本来可以和与Rademacher distribution或任何其他值一样。
但是也有其他原因导致和一个方便的选择。首先,伯努利分布随机变量的期望值为
...因此从分布定义中可以立即看出这一点。样本均值是最大似然估计因为取 0 和 1 的算术平均值会导致整个样本中 1 的比例。
此外,我们可以很容易地将伯努利分布扩展到二项分布,即从单抽中的单次成功建模转变为建模成功平局——你可以总结一下是很有帮助的's 来获得成功的次数。
这种编码便于计算还有很多其他原因,要了解更多信息,请参阅为什么性别通常编码为 0/1 而不是 1/2,例如?
数学方便。这是一个示例:如果您将成功案例设置为和失败的情况是,那么你就有了二项式变量,它计算成功的次数独立的伯努利试验, 和, 可以写成
所以,
此外,