在非正态分布中,期望值与均值、中位数等有何关系?

机器算法验证 意思是 期望值 中位数
2022-03-15 11:33:04

在非正态分布(例如偏正态)中,连续随机变量的期望值如何与其算术平均值、中位数等相关?我对任何常见/有趣的分布感兴趣(例如对数正态分布、简单的双/多峰分布、其他任何奇怪而美妙的分布)。

我主要寻找定性答案,但也欢迎任何定量或公式化的答案。我特别希望看到任何使其更清晰的视觉表示。

4个回答

(部分转换自我上面现在已删除的评论)

期望值和算术平均值是完全相同的东西。中位数与均值的关系非常重要,但您可以对它们的关系说几句:

  • 当分布对称时,均值和中位数相同

  • 当分布呈负偏态时,中位数通常大于均值

  • 当分布呈正偏态时,中位数通常小于均值

对数正态分布随机变量的谐波、几何和算术平均值之间存在很好的关系分布参数与不同均值的关系如下:XLN(μ,σ2)

  • HM(X)=eμ12σ2(谐波平均值),
  • GM(X)=eμ (几何平均数),
  • AM(X)=eμ+12σ2(算术平均值)。

使用这些恒等式,不难看出谐波和算术平均值的乘积产生几何平均值的平方,即

HM(X)AM(X)=GM2(X).

由于所有值都是正数,我们可以取平方根,发现的几何平均数是的调和平均数和的算术平均数XXX的几何平均数,即

GM(X)=HM(X)AM(X).

此外,众所周知的 HM-GM-AM 不等式

HM(X)GM(X)AM(X)

可以精确地表示为

HM(X)GVar(X)=GM(X)=AM(X)GVar(X),

其中几何方差GVar(X)=eσ2

为了完整起见,还有一些分布的平均值没有很好地定义。一个经典的例子是柯西分布(这个答案很好地解释了为什么)。另一个重要的例子是指数小于 2的帕累托分布。

虽然数学平均值和期望值的定义相同是正确的,但对于偏态分布,这种命名约定会产生误导。

想象一下,您正在向一位朋友询问她所在城市的房价,因为您真的很喜欢那里,并且真的考虑搬到那个城市。

如果房屋奖励的分布是单峰且对称的,那么您的朋友可以告诉您房屋的平均价格,并且实际上您可以期望在市场上找到大多数围绕该均值的房屋。

但是,如果房价的分布是单峰的并且是偏斜的,例如右偏,大多数处于较低价格范围内的房子在左边,而只有一些高价的房子在右边,那么平均值将“偏斜”到高价正确的。

对于这种单峰、倾斜的房价分布,您可以预期市场上的大多数房屋都在中位数附近。