在我的概率类中,经常使用术语“随机变量之和”。但是,我不知道这到底是什么意思?
我们是在谈论来自随机变量的一堆实现的总和吗?如果是这样,那加起来不是一个数字吗?随机变量实现的总和如何将我们引向分布或任何类型的 cdf / pdf / 函数?如果它不是随机变量实现,那么究竟添加了什么?
在我的概率类中,经常使用术语“随机变量之和”。但是,我不知道这到底是什么意思?
我们是在谈论来自随机变量的一堆实现的总和吗?如果是这样,那加起来不是一个数字吗?随机变量实现的总和如何将我们引向分布或任何类型的 cdf / pdf / 函数?如果它不是随机变量实现,那么究竟添加了什么?
随机变量的物理、直观模型是在一张或多张纸条上写下人口中每个成员的名字——“票”——然后把这些票放进一个盒子里。将盒子里的东西彻底混合,然后盲目地抽出一张票——就像在彩票中一样——模拟了随机性。非均匀概率是通过在盒子中引入可变数量的票来建模的:更多的票给更有可能的成员,更少的票给不太可能的成员。
随机变量是与总体中的每个成员相关的数字。(因此,为了保持一致性,给定成员的每张票上都必须写有相同的数字。)通过在票上为多个数字保留空间来模拟多个随机变量。我们通常给这些空间起名字,比如 和. 这些随机变量的总和是通常的总和:在每张票上为总和保留一个新空间,读出 等在每张票上,并将它们的总和写在那个新的空间中。这是在票上写数字的一致方式,所以它是另一个随机变量。
该图描绘了一个代表人口的框和三个随机变量,, 和. 它包含六张票:三张用于(蓝色)给它一个概率,这两个为(黄色)给它一个概率, 一个为(绿色)给它一个概率. 为了显示票上写的内容,它们在混合之前显示。
这种方法的美妙之处在于问题的所有自相矛盾的部分都证明是正确的:
随机变量的总和确实是一个单一的、确定的数字(对于总体中的每个成员),
但它也导致了一个分布(由总和出现在框中的频率给出),并且
它仍然有效地模拟了一个随机过程(因为票仍然是盲目地从盒子里抽出来的)。
以这种方式,总和可以同时具有确定的值(由应用于每张票上的数字的加法规则给出),而实现——这将是一张从盒子中抽出的票——没有价值,直到它被执行。
这种从盒子中抽奖的物理模型在理论文献中被采用,并通过样本空间(总体)、sigma 代数(及其相关的概率度量)和作为样本空间上定义的可测量函数的随机变量的定义进行了严格的定义.
在“什么是随机变量?”中详细说明了对随机变量的说明,并附有实际示例。.
这句话背后没有什么秘密,它就像你想象的那样简单:如果 X 和 Y 是两个随机变量,它们的和是 X + Y,这个和也是一个随机变量。如果 X_1, X_2, X_3,...,X_n 和是 n 个随机变量,它们的和是 X_1 + X_2 + X_3 +...+ X_n 并且这个和也是一个随机变量(并且这个和的实现是单个数,即 n 个实现的总和)。
为什么你在课堂上这么多谈论随机变量的总和?一个原因是(惊人的)中心极限定理:如果我们对许多独立的随机变量求和,那么我们可以(几乎)独立于和中单个变量的分布“预测”这个和的分布!总和趋于成为正态分布,这可能是我们在现实世界中如此频繁地观察正态分布的可能原因。
rv 是事件发生与实数之间的关系。比如说,如果下雨,则值 X 为 1,如果不是,则为 0。你可以让另一个 rv Y 在寒冷时等于 10,在炎热时等于 100。因此,如果下雨且寒冷,则 X=1、Y=10 和 X+Y=11。
X+Y 值为 10(不下雨);11(下雨,冷),100(不下雨,热)和 110(下雨,热)。如果您计算我们的事件概率,那么您将获得这个新 rv X+Y 的 PMF。
这些答案都没有给出一种数学上严格的方法来考虑随机变量的总和。注意不需要在相同的结果域上定义,即使他们这样做,不能理解为两个功能的总和。相反,它们应该首先扩展到域. 例如,让是相同的函数在哪里. 域名应该是 {(Head,Tail),(Tail,Head),(Head, Head),(Tail,Tail)}。现在是这个产品空间上的函数,它们的值分别由第一个和第二个坐标决定。sum现在可以理解为通常意义上的函数的求和。另请注意,场和概率测度也应该重新定义。说独立是指定产品度量的一种方式。