预期值与最可能值(模式)

机器算法验证 可能性 分布 期望值 卡方分布 模式
2022-02-10 20:09:43

的期望值是均值,即加权平均值 f(x)

E[x]=+xf(x)dx

最可能的值是众数,即最可能的值。

然而,我们是否期望以某种方式多次从这里引用E[x]

如果结果的可能性不相等,则必须用加权平均代替简单平均,这要考虑到某些结果比其他结果更有可能的事实。然而,直觉保持不变:的期望值是人们期望平均发生的值。xix

我无法理解“平均发生”是什么意思,这是否意味着,例如,采取措施很多时间我希望看到的其他值更多?但这不就是模式的定义吗?E[x]x

那么如何解读声明呢?的概率含义是什么?E[x]


我还想举一个我确实感到困惑的例子。研究分布我了解到模式,而,其中是数据的自由度。χ2χmode2=ν2E[χ2]=νν

我在大学听说,在使用最小二乘法拟合一组数据后进行因为“这就是一般情况”。χ2χ2ν


我是否误解了所有这一切,或者预期值在某种程度上很有可能?(即使可能的值当然是众数)

4个回答

对于正态分布,期望值,也就是平均值,等于众数。

一般来说,期望值不仅不是最有可能(或密度最高),而且可能没有发生的机会。例如,考虑等于 0 或 2 的随机变量 X,每个变量的概率为 0.5。那么 EX = 1,但期望值 1 的发生概率为 0,而 0 和 2 都是分布的模式。

引用“x 的期望值是人们期望平均发生的值”是非技术外行的语言,从您的困惑中可以看出,这只会使事情变得混乱。期望值在概率中具有非常特殊的含义,即数学平均值。而在外行的语言中,预期值或“平均”可能是预期通常会发生的事情。如果“平均”被解释为所发生事件的数学平均值,则这些可以调和。

期待你的,

乔平均

期望值是先验的,非常抽象,没有理由认为它是最可能的结果;正如其他人指出的那样,很容易构造是连续的,则与密度相同)

P(X=E(X))=0
X

期望值的唯一理由,也是我们“期望经常看到它”的原因,是大数定律

如果你有独立的同分布变量 ,那么nXi

X1++XnnE(X)

(对于的合适含义,目前研究毫无意义)

这是什么意思?想象一下,你投掷一枚硬币,头部着地的概率为,我们将与数字相关联,尾部着地的概率(即)。最可能的结果是什么?1!(即头)期望值是多少?p>1211p0

E(X)=1p+0(1p)=p

现在显然“p”永远不会发生(它要么是头部,要么是尾部,要么是 0 要么是 1)。

但是投掷硬币 10.000 次,并记录它出现的次数超过总投掷次数。这个数字反映了我们直觉上认为的平均数(“平均正面数”)。大数定律告诉你这个数将接近E(X)=p

我不喜欢“期望值”这个词,也没有在教授概率时使用它。在我看来,“算术平均值”更好,因为 6 面骰子的算术平均值是 3.5,但不会出现这样的数字。我在大学时确实听说过这个概念的“期望值”这个词。许多技术术语与明显的非技术含义不一致。(“或”浮现在脑海中。)

请注意,分布可能有多个众数,但算术平均值是唯一的。众数、均值和中位数是不同的,并且有不同的用途。

使用离散分布最容易看出差异:

考虑两组值,其中每个数字均等可能被抽取:{1,2,2,2,10} 和 {1,2,2,2,3}。

两者具有相同的模式 (2),但预期值不同。期望值对大值赋予额外的权重,而模式只是寻找经常出现的值。因此,如果您多次从该分布中提取,您的样本平均值将接近预期值,而最常见的整数将接近众数。

模式定义为而如上所示,期望值在上积分,因此它考虑了每个 x 的权重。mode=argmaxf(x)xf(x)

在学习统计学时,使用语言来区分不同的集中趋势度量是一个常见的问题。例如,中位数是另一种不受平均值等大值影响的度量。