为什么期望与算术平均值相同?

机器算法验证 期望值
2022-01-25 04:28:00

今天我遇到了一个新的话题,叫做数学期望。我正在关注的书说,期望是来自任何概率分布的随机变量的算术平均值。但是,它将期望定义为某些数据的乘积和它的概率之和。这两个(平均值和期望值)怎么可能相同?概率乘以数据的总和如何成为整个分布的平均值?

4个回答

非正式地,概率分布定义了随机变量结果的相对频率——期望值可以被认为是这些结果的加权平均值(由相对频率加权)。类似地,期望值可以被认为是一组数字的算术平均值,这些数字与它们的发生概率成正比(在连续随机变量的情况下,这并不完全正确,因为特定值具有概率0)。

期望值和算术平均值之间的联系最清楚的是离散随机变量,其中期望值是

E(X)=SxP(X=x)

在哪里S是样本空间。例如,假设您有一个离散随机变量X这样:

X={1with probability 1/82with probability 3/83with probability 1/2

也就是说,概率质量函数是P(X=1)=1/8,P(X=2)=3/8, 和P(X=3)=1/2. 使用上面的公式,期望值为

E(X)=1(1/8)+2(3/8)+3(1/2)=2.375

现在考虑以与概率质量函数完全成比例的频率生成的数字 - 例如,一组数字{1,1,2,2,2,2,2,2,3,3,3,3,3,3,3,3}- 二1s,六2s和八3s。现在取这些数字的算术平均值:

1+1+2+2+2+2+2+2+3+3+3+3+3+3+3+316=2.375

你可以看到它完全等于预期值。

期望是随机变量的平均值或平均值,而不是概率分布。因此,对于离散随机变量,随机变量取值的加权平均值,其中加权是根据这些单独值的相对出现频率。对于绝对连续的随机变量,它是值 x 乘以概率密度的积分。观察到的数据可以看作是一组独立同分布随机变量的值。样本均值(或样本期望)定义为数据相对于观测数据的经验分布的期望。这使得它只是数据的算术平均值。

让我们密切关注定义:

平均值定义为一组数字的总和除以该集合中的数字数量。计算将是“对于 i 在 1 到 n,(x sub i 的总和)除以 n”。

期望值(EV)是它所代表的实验重复的长期平均值。计算将是“对于 1 到 n 中的 i,事件 x sub i 的总和乘以它的概率(并且所有 p sub i 的总和必须 = 1)。”

在公平骰子的情况下,很容易看出均值和 EV 相同。平均值 - (1+2+3+4+5+6)/6 - 3.5 和 EV 将是:

概率 xp*x

0.167 1 0.17

0.167 2 0.33

0.167 3 0.50

0.167 4 0.67

0.167 5 0.83

0.167 6 1.00

EV=sum(p*x) = 3.50

但是,如果模具不“公平”怎么办。制作不公平模具的一种简单方法是在 4、5 和 6 面相交处的拐角处钻一个孔。进一步假设现在在我们改进的新弯曲骰子上掷出 4、5 或 6 的概率现在是 0.2,而掷出 1、2 或 3 的概率现在是 0.133。它是同一个骰子,有 6 个面,每面一个数字,这个骰子的平均值仍然是 3.5。然而,在多次掷骰子之后,我们的 EV 现在是 3.8,因为事件的概率不再对所有事件都相同。

概率 xp*x

0.133 1 0.13

0.133 2 0.27

0.133 3 0.40

0.200 4 0.80

0.200 5 1.00

0.200 6 1.20

EV=sum(p*x) = 3.80

同样,让我们​​小心并回到定义,然后得出结论,一件事总是与另一件事“相同”。看看普通模具是如何设置的,然后在其他 7 个角上钻一个孔,看看 EV 是如何变化的——玩得开心。

鲍勃_T

“均值”和“期望值”之间的唯一区别是均值主要用于频率分布,而期望用于概率分布。在频率分布中,样本空间由变量及其出现频率组成。在概率分布中,样本空间由随机变量及其概率组成。现在我们知道样本空间中所有变量的总概率必须=1。基本区别就在这里。期望的分母项总是=1。(即总和 f(xi) = 1) 但是对频率总和没有这样的限制(基本上是条目总数)。