寻找一个分布,其中:均值 = 0,方差是可变的,偏斜 = 0 并且峰度是可变的

机器算法验证 分布 方差 偏度 时刻 峰度
2022-03-25 16:05:16

我的目标是运行模拟以估计分布的影响Y(自变量)在某个二元结果上X(因变量)。Y必须始终具有 0 的平均值并且必须是对称的(skew = 0),但我想独立地改变方差(最终从 1 到 250)和峰度(从正方形到窄峰,最终从 -1.2 到3) 的Y.

我一直在研究各种发行版,但我发现没有一个似乎适合这种目的。

你能帮我选择一个分布,我可以轻松地改变方差和峰度,同时保持均值和偏斜为零?

编辑

更多描述

我意识到仍然存在未解决的问题(虽然不是很多)。我的偏好是:

  • 平均值 = 0
  • 方差:可以变化
  • 对称:是的(起初我没有意识到 skew=0 并不意味着对称)
  • 峰度:可以独立于方差而变化
  • 模式数量:单峰(对这个问题不严格)
  • 界:无所谓。
  • 连续/离散:没关系。如果它是连续的,我将不得不采用离散的近似值,但我不介意
  • 尾巴行为:我对尾巴的影响很感兴趣。我认为通过允许峰度变化来描述就足够了,但也许我应该描述更高的时刻......

语境

我在群体遗传学领域工作,我对分散核的方差和峰度的影响感兴趣(Y)关于给定等位基因的固定概率(X)。我对模拟分散分布偏斜的情况不感兴趣,并且平均值应始终位于父母的位置(无论如何,这可以通过简单的加法很容易地解决)。以前的研究认为(没有显示任何证据)方差和峰度很重要,经验研究表明分散核通常是尖峰的。不确定我是否正确解决了您的评论。我有吗?谢谢

2个回答

有很多可能性。一种可能性是采用一对家族来覆盖正负超峰态,当匹配前四个时刻时,明显的候选者是皮尔逊家族分布。

缩放 t 分布族具有参数 (σν) 影响方差和峰度。但是,它们的峰度只能高于正常值。

那将有过多的峰度6ν4(所以如果你希望它只达到 3,你会想要ν6)。

它有方差σ2νν2, 所以给定ν您可以选择σ产生所需的方差

然后,按比例偏移(平均为 0)的 beta 分布族将处理峰度小于正态的情况(两个族都将正态作为限制情况)。所以拿一个Beta(α,α)并将其向下移动12然后缩放到所需的方差。

这是一个Beta(α,α)峰度过高6(2α+3),并包括您想要的制服α=1.

在缩放之前它有差异14(2α+1); 所需方差与未缩放方差的比率将是所需比例的平方。

在此处输入图像描述

看看重尾 Lambert W x F 分布(免责声明:我是作者)。随机变量YLambertW×F是一个重尾版本XF,您可以在其中使用 tail 参数控制尾部δ0: 为了δ=0,X=Y因此 Lambert W x F 与 F 相同;并且对于δ你得到越来越重的尾巴Y(Tukey 的 h 是 Lambert W x F 随机变量的特例,对于 F = Gaussian 和α=1)。

请注意,这适用于任何(非病态)连续分布——不仅仅是正态分布。

对于均值 = 0、对称和可变方差和峰度的特定要求,您可以设置μ=0,δ=δr=δ(默认情况下),并改变比例σ和尾部参数δ.

在 R 中,这是在LambertW包中实现的(使用type = "h"and distname = "normal")。

另见(我的)相关回复: