“随机变量”是什么意思?

机器算法验证 数理统计 随机变量 直觉 定义
2022-02-02 22:14:27

当他们说“随机变量”时,他们是什么意思?

4个回答

介绍

在考虑最近的评论时,我注意到到目前为止所有回复都受到使用“变量”等未定义术语和“未知”等模糊术语的影响,或者诉诸诸如“函数”和“概率空间”等技术数学概念。对于想要简单、直观、准确定义“随机变量”的非数学人士,我们应该说些什么?在对随机现象的简单模型进行了一些初步描述之后,我提供了一个足够短的定义,可以放在一行上。因为它可能不完全满足行家,后来解释了如何将其扩展到通常的技术定义。

盒子里的票

处理随机变量背后的想法的一种方法是诉诸随机性的盒装票模型该模型用装满票的盒子代替了实验或观察。每张票上都写着实验的可能结果(结果可以像“正面”或“反面”一样简单,但实际上它是更复杂的事物,例如股票价格历史、长期实验的完整记录或文档中所有单词的序列.) 所有可能的结果在票中至少出现一次;一些结果可能会出现在许多票上。

我们没有实际进行实验,而是彻底——但盲目地想象——混合所有票并只选择一张。如果我们能证明真实的实验应该以这种方式进行,那么我们就可以将一个可能复杂(且昂贵且冗长)的真实世界实验简化为一个简单、直观的思想实验(或“统计模型”) ”)。该模型提供的清晰和简单性使得分析实验成为可能。

一个例子

标准示例涉及掷硬币和骰子以及抽纸牌的结果。这些都因为它们的琐碎性而让人分心,所以为了说明,假设我们担心 2016 年美国总统大选的结果。作为(微小的)简化,我将假设两个主要政党之一——共和党(R)或民主党(D)——将获胜。因为(根据目前可用的信息)结果是不确定的,我们想象把票放在一个盒子里:一些票上写着“R”,而另一些票上写着“D”。我们的结果模型是从这个盒子中抽出一张票。

缺少一些东西:我们还没有规定每个结果会有多少票。事实上,找出这一点是统计学的主要问题:根据观察(和理论),关于盒子中每个结果的相对比例可以说什么?

(我希望清楚的是,盒子中每种票的比例决定了它的属性,而不是每张票的实际数量。比例被定义 - 像往常一样 - 是每种票的数量除以票的总数。例如,一个带有一张“D”票和一张“R”票的盒子的行为与一个带有一百万张“D”票和一百万张“R”票的盒子完全一样,因为在任何一种情况下,每种类型都是所有彩票的 50%,因此当彩票完全混合时,每张都有 50% 的机会被抽中。)

使模型量化

但是我们不要在这里追究这个问题,因为我们已经接近定义随机变量的目标了。到目前为止,该模型的问题在于它是不可量化的,而我们希望能够用它来回答定量问题。而且我的意思也不是微不足道的问题,而是真实的、实际的问题,例如“如果我的公司有 10 亿欧元投资于美国海上化石燃料开发,那么这项投资的价值会因 2016 年大选而发生多大变化?” 在这种情况下,模型非常简单,以至于我们无法为这个问题找到一个现实的答案,但我们可以咨询我们的经济工作人员并征求他们对两种可能结果的意见:

  1. 如果民主党获胜,投资会有多大变化?(假设答案是美元。)d

  2. 如果共和党获胜,情况会有多大变化?(假设答案是美元。)r

答案是数字。为了在模型中使用它们,我会要求我的工作人员检查盒子里的所有票,在每张“D”票上写“美元”,在每张“R”票上写“美元”。现在我们可以清楚地量化地对投资的不确定性进行建模:它在选举后的价值变化与从这个盒子中随机抽取的单张票上收到的金额相同。dr

该模型帮助我们回答有关投资的其他问题。例如,我们应该对投资价值有多大的不确定性尽管对于这种不确定性有(简单的)数学公式,但我们可以通过重复使用我们的模型(可能超过一千次)来合理准确地重现他们的答案,以查看实际发生的结果类型并测量它们的传播。 盒装票模型为我们提供了一种对不确定结果进行定量推理的方法。

随机变量

为了获得关于不确定或可变现象的定量答案,我们可以采用盒装票模型并在票证上写上数字。 这个写数字的过程只需要遵循一个规则:它必须是一致的。在这个例子中,每张民主党票上都必须写有“美元”——没有例外——每张共和党票上都必须写有“美元”。dr

随机变量是在盒子里的票上写数字的任何一致方式。

(对此的数学符号是为重新编号过程命名,通常使用大写拉丁字母,如写在票上的识别信息通常用小字母命名,通常是(小写希腊语“omega ")。通过随机变量与票相关联的值表示为。在这个例子中,我们可以说类似“是代表投资价值变化的随机变量." 它将通过声明XYωXωX(ω)XX(D)=dX(R)=r. 在更复杂的情况下,的值由更复杂的描述给出,并且通常由公式给出。例如,门票可能代表股票一年的收盘价,而随机变量可能是该股票的某些衍生品(例如看跌期权)在特定时间的价值。期权合约描述了的计算方式。期权交易者正是使用这种模型来为他们的产品定价。)XXX

您是否注意到这样的既不是随机的也不是变量?它也不是“不确定”或“未知”。这是一个明确的分配(数字到结果),我们可以用充分的知识和完全的确定性写下来。随机的从盒子里抽票的过程;可变的可能绘制的票上的值。X

还要注意,评估投资所涉及的两个不同问题的明确分离:我要求我的经济学家为我确定,但不对选举结果发表意见。我将使用其他信息(可能通过请来政治顾问、占星家、使用通灵板或其他方式)来估计每个“D”和“R”票放入盒子的比例。X


之后:关于可测量性

当随机变量的定义伴随着“可测量”的警告时,定义者的想法是将盒装票模型推广到具有无限多可能结果的情况。(从技术上讲,只有在不可数无限的结果或涉及非理性概率的情况下才需要它,即使在后一种情况下也可以避免。)对于无限多的结果,很难说总数的比例是多少。如果有无限多的“D”票和无限多的“R”票,它们的相对比例是多少?我们不能仅仅用一个无穷除以另一个无穷大!

在这些情况下,我们需要一种不同的方式来指定比例。“可测量”的一组票是盒子中可以定义其比例的任何票的集合。完成此操作后,我们一直认为是“比例”的数字称为“概率”。(并非每个票的集合都需要有一个与之相关的概率。)

除了满足一致性要求外,随机变量还必须允许我们计算与关于结果的自然问题相关的概率。具体来说,我们希望确保“值介于某某 ( ) 和某某 ( ) 之间的可能性有多大?”形式的问题?无论我们为限制给出什么两个值,实际上都会有数学上明确定义的答案。这种重写过程被称为是“可测量的”。根据定义,所有随机变量都必须是可测量的。XX(ω)abab

随机变量是其值取决于未知事件的变量。我们可以将未知事件概括为“状态”,那么随机变量就是状态的函数。

例子:

假设我们有三个骰子()。然后状态D1D2D3S=(D1,D2,D3)

  1. 一个随机变量是 5 的数量。这是:X

X=(D1=5?)+(D2=5?)+(D3=5?)

  1. 另一个随机变量是掷骰子的总和。这是:Y

Y=D1+D2+D3

非正式地,随机变量是一种为每个可能的结果分配数字代码的方法。 *

示例 1

我掷硬币。一组可能的结果(也称为“样本空间”)可以写为{H,T}

的示例可能会分配也就是说,heads 被“编码”为而 tails 被“编码”为XX(H)=1X(T)=010

示例 2

我从标准的 52 张牌组中抽一张牌。可能的结果集是

{A,K,,2,A,K,,2,A,K,,2,A,K,,2}.

在桥牌中,一张王牌价值 4 高牌点,一张国王 3,一张王后 2 和一张杰克 1。任何其他牌价值 0 点。

所以我们可以让是对应的随机变量,例如 .YY(A)=4Y(J)=1Y(7)=0


随机变量的意义何在?一个简单的答案是,像“ ”、“ ”或“ ”这样的抽象符号有时很难处理。因此,我们将它们转换为更易于操作的数字。HTA

*正式地,随机变量是将每个结果(在样本空间中)映射到实数的函数。

与常规变量不同,随机变量不能代替单个不变的值。相反,可以说明诸如随机变量分布之类的统计特性。分布是一个函数,它提供变量在给定值上或在给定某些参数(例如均值或标准差)的范围内的概率。

如果分布描述来自可数集合(例如整数)的值,则随机变量可能被分类为离散变量。随机变量的另一种分类是连续的,如果分布涵盖来自不可数集合(例如实数)的值,则使用该分类。