为什么期望是在从概率分布中提取的有限数量的点上计算的?

人工智能 数学 概率分布 期待
2021-11-13 12:00:07

在此处输入图像描述

在此处输入图像描述

这是来自 Bishop 的《模式识别》一书。为什么这里的期望是一个简单的平均值?为什么是f(x)不乘以p(x)?

1个回答

当我们说我们有N“从概率分布或概率密度中提取”的点,这意味着每个点xn有正确的概率p(xn)当我们对我们的样本进行抽样时从分布中抽样nth观点。

例如,假设我们希望计算/估计通过抛硬币给出的分布的期望值,该分布的权重使得它有三分之二的时间落在正面(正面的价值 =1),并且有三分之一的时间出现尾巴(尾巴的值 =0)。这意味着真实概率为:

  • p(1)=23
  • p(0)=13

在这种情况下,我们实际上不必通过抽样来估计任何东西。确切的概率是已知的,所以我们可以将期望值计算为p(1)×1+p(0)×0=23.

但是现在假设我们不确切知道硬币是如何加权的,即我们不知道确切的值p(1)p(0). 如果我们简单地翻转我们的加权硬币N=100次,我们会期待找到关于67样品xn=1, 关于33样品xn=0(四舍五入为整数,因为我们无法获得非整数的观测值)。所以我们不能明确地使用概率(因为我们不知道它们),但它们会隐含地出现在我们对每个可能的数据点的重复观察次数中。