在非正态分布(例如偏正态)中,连续随机变量的期望值如何与其算术平均值、中位数等相关?我对任何常见/有趣的分布感兴趣(例如对数正态分布、简单的双/多峰分布、其他任何奇怪而美妙的分布)。
我主要寻找定性答案,但也欢迎任何定量或公式化的答案。我特别希望看到任何使其更清晰的视觉表示。
在非正态分布(例如偏正态)中,连续随机变量的期望值如何与其算术平均值、中位数等相关?我对任何常见/有趣的分布感兴趣(例如对数正态分布、简单的双/多峰分布、其他任何奇怪而美妙的分布)。
我主要寻找定性答案,但也欢迎任何定量或公式化的答案。我特别希望看到任何使其更清晰的视觉表示。
(部分转换自我上面现在已删除的评论)
期望值和算术平均值是完全相同的东西。中位数与均值的关系非常重要,但您可以对它们的关系说几句:
当分布对称时,均值和中位数相同
当分布呈负偏态时,中位数通常大于均值
当分布呈正偏态时,中位数通常小于均值
对数正态分布随机变量的谐波、几何和算术平均值之间存在很好的关系。分布参数与不同均值的关系如下:
使用这些恒等式,不难看出谐波和算术平均值的乘积产生几何平均值的平方,即
由于所有值都是正数,我们可以取平方根,发现的几何平均数是的调和平均数和的算术平均数的几何平均数,即
此外,众所周知的 HM-GM-AM 不等式
可以精确地表示为
其中是几何方差。
虽然数学平均值和期望值的定义相同是正确的,但对于偏态分布,这种命名约定会产生误导。
想象一下,您正在向一位朋友询问她所在城市的房价,因为您真的很喜欢那里,并且真的考虑搬到那个城市。
如果房屋奖励的分布是单峰且对称的,那么您的朋友可以告诉您房屋的平均价格,并且实际上您可以期望在市场上找到大多数围绕该均值的房屋。
但是,如果房价的分布是单峰的并且是偏斜的,例如右偏,大多数处于较低价格范围内的房子在左边,而只有一些高价的房子在右边,那么平均值将“偏斜”到高价正确的。
对于这种单峰、倾斜的房价分布,您可以预期市场上的大多数房屋都在中位数附近。