一个正态分布但高度偏斜的分布是否被认为是高斯分布?

机器算法验证 分布 正态分布 偏度 偏正态分布
2022-02-28 00:05:02

我有一个问题:您认为每天在 YouTube 上花费的时间分布情况如何?

我的回答是它可能是正态分布的并且高度左偏。我预计在一种模式下,大多数用户会花费一些平均时间,然后是长长的右尾,因为有些用户是压倒性的高级用户。

这是一个公平的答案吗?这种分布有更好的词吗?

4个回答

正态分布不是高度偏斜的。这是一个矛盾。正态分布变量的偏斜 = 0。

如果它有很长的右尾,那么它就是向右倾斜的。

在此处输入图像描述

由于 skew !=0,它不可能是正态分布,它可能是单峰偏态正态分布:

https://en.wikipedia.org/wiki/Skew_normal_distribution

每天一小部分肯定不是负数。这排除了正态分布,它在整个实轴上具有概率质量 - 特别是在负半轴上。

幂律分布通常用于模拟收入分布、城市规模等。它们是非负的并且通常高度偏斜。这些将是我第一次尝试在观看 YouTube 上的建模时间。(或监控 CrossValidated 问题。)

更多关于幂律的信息可以在这里这里找到,或者在我们的标签。

它可能是对数正态分布。如此处所述

用户在在线文章(笑话、新闻等)上的停留时间遵循对数正态分布。

给出的参考文献是:尹沛峰;罗平;李王建;王敏(2013)。沉默也是证据:从心理学角度解释推荐的停留时间。ACM 国际 KDD 会议。