在模拟中多次重复掷硬币组的正确术语是什么?

机器算法验证 二项分布 术语 伯努利分布 正态近似
2022-03-28 09:55:03

我之前发布了一个导致很多混乱的问题,因为我的术语不正确。我决定发布这个问题,以确保我用正确的术语开始我的问题。

我将用(希望)中性术语介绍下面的问题

我正在模拟掷硬币(或翻转)。在模拟中,我将多次投掷组合在一起并计算组内的正面。我会多次重复此过程以获取多个组的人数。

示例:如果我的组大小为 5 并重复该过程 3 次:

  • 第一组:HTTTT = 1
  • 第 2 组:THHHT = 3
  • 第 3 组:HHHHT = 4

什么是公认的术语...

  1. 对于一组投掷,其中计算组中的正面数量?注意:以前,我将其称为sample
  2. 对于重复的多组投掷?注意:以前,我指的是重复

如果答案可以为所提供的定义提供权威参考,那就太好了。

2个回答

在您的模拟中,您希望从 3 次实现(或平局或观察)中计算一系列 5 次独立伯努利试验的成功次数(正面)。

在 R 中,这可以使用rbinom(n, size, prob)函数来完成,其中n是观察次数,size是试验次数和prob每次试验的成功概率。另请参阅此处以获取函数参考(我相信这在其他编程语言中也是类似的)。

然后可以计算 5 次试验的成功次数(假设硬币公平):

> set.seed(123)
> rbinom(3, 5, .5)
[1] 2 3 2

在这种情况下,我们有 2 次成功(第一次观察)、3 次成功(第二次观察)、2 次成功(第三次观察)。

因此,第 1、2、3 组是每次观察5次试验的观察结果。


编辑:添加插图

这是一个高尔顿板的插图,可以更清楚地说明试验观察之间的区别是什么:

高尔顿板

每个球的路径代表一个观察结果(红色箭头),通过 6 个左/右决策或6 个试验(蓝色三角形)最终进入其中一个垃圾箱。确切的概率(Pr) 可以使用二项式概率质量函数计算降落在其中一个垃圾箱中的次数

Pr(X=k)=(nk)pk(1p)nk,
在哪里X表示随机变量,k成功次数(例如弹跳),n数字试验,和p每次试验结果的概率。

在 R 中,您可以使用该dbinom() 函数来计算落入每个箱子的确切概率(从左到右并假设p=0.5):

dbinom(6, 6, .5)
#[1] 0.015625
dbinom(5, 6, .5)
#[1] 0.09375
dbinom(4, 6, .5)
#[1] 0.234375
dbinom(3, 6, .5)
#[1] 0.3125
dbinom(2, 6, .5)
#[1] 0.234375
dbinom(1, 6, .5)
#[1] 0.09375
dbinom(0, 6, .5)
#[1] 0.015625

或通过模拟(在本例中为 100,000 次观察和 6 次试验):

bounces <- rbinom(100000, 6, .5)
mean(bounces == 6)
#[1] 0.01554
mean(bounces == 5)
#[1] 0.09325
mean(bounces == 4)
#[1] 0.23468
mean(bounces == 3)
#[1] 0.31349
mean(bounces == 2)
#[1] 0.23486
mean(bounces == 1)
#[1] 0.09287
mean(bounces == 0)
#[1] 0.01531

我理解你的困惑。一旦您根据随机变量、结果集和随机过程/变量的实现/观察进行思考,事情就会变得更加清晰

掷硬币

随机变量是将随机实验的结果映射到数字的函数。在抛硬币的情况下,我们可以定义一个随机变量 X,当随机变量取值为 H 时取值为 1,当随机变量取值为 T 时取值为 0。

在这种情况下,只有两种可能的结果:H 或 T。所有可能结果的集合称为结果集样本空间在掷硬币的情况下,结果集仅包含 2 个结果 {H,T}。

现在我们已经定义了一个随机变量和结果集,我们可以重复掷硬币的随机实验。让我们做 3 次,观察随机过程的实现。你可能在第一次翻转时获得了 H,第二次获得了 T,第三次获得了 H。您的随机变量根据上述规则为每个结果分配数字,因此将分别采用值 1、0 和 1。您现在有一个随机变量 X 的三个观察值的样本。一个只取 2 个值的随机变量恰好有一个特殊的名称 - 伯努利变量。

翻转5个硬币

现在让我们看一个完全不同的随机实验——掷 5 个硬币并计算正面的数量。在这种情况下,我们可以定义一个随机变量 Y 来表示在 5 次抛硬币中观察到的正面数量。这里的随机实验包括翻转 5 个硬币。该实验有 2^5=32 个可能的结果,但随机变量 Y {0,1,2,3,4,5} 只有 5 个可能的结果。请记住,我们的随机变量 Y 将掷 5 个硬币的实验结果映射到数字(正面数)。下图描述了这种映射。

在此处输入图像描述

您将这个随机实验重复了 3 次,得到:HTTTT、THHHT 和 HHHHT。随机实验的这些结果映射到随机变量 Y 的以下值:1、3 和 4。您现在有一个随机变量Y的三个观察值样本。这样一个变量,它计算成功的次数(即Heads) 在 n 次重复的伯努利试验中有一个特殊的名称 - 二项式变量。

我希望这有帮助。