伽玛与对数正态分布

机器算法验证 密度函数 伽马分布 对数正态分布
2022-01-28 12:31:46

我有一个实验观察到的分布,看起来非常类似于 gamma 或对数正态分布。我读过对数正态分布是随机变量的最大熵概率分布X其中的均值和方差ln(X)是固定的。伽马分布是否有任何类似的性质?

2个回答

至于质的差异,正如您所说,对数正态和伽马非常相似。

实际上,在实践中,它们通常用于对相同的现象进行建模(有些人会使用伽玛,而其他人则使用对数正态)。例如,它们都是常数变异系数模型(对数正态的 CV 为eσ21,对于伽马,它是1/α)。

[你问,如果它取决于一个参数,它怎么可能是常数?它适用于您对比例建模(对数比例的位置);对于对数正态,μ充当比例参数,而对于 gamma,比例是不是形状参数的参数(如果使用形状速率参数化,则为它的倒数)。我将调用伽马分布的比例参数β. 伽玛 GLM 模型均值 (μ=αβ) 同时持有α持续的; 在这种情况下μ也是一个尺度参数。具有变化的模型μ和常数α或者σ分别将具有恒定的 CV。]

您可能会发现查看它们的日志密度很有启发性,这通常会显示出非常明显的差异。

对数正态随机变量的对数是……正态的。它是对称的。

伽马随机变量的对数是左偏斜的。根据形状参数的值,它可能非常倾斜或几乎对称。

这是一个示例,对数正态和伽马的均值为 1,方差为 1/4。上图显示密度(绿色为伽马,蓝色为对数正态),下图显示对数的密度:

伽马和对数正态,对数的密度和密度

(绘制原木密度的对数也很有用。即在上面的 y 轴上取对数刻度)

这种差异意味着 gamma 左侧的尾部较多,右侧的尾部较少;对数正态的最右尾较重,左尾较轻。实际上,如果您查看对数正态和伽马的偏度,对于给定的变异系数,对数正态更偏右(CV3+3CV) 比伽马 (2CV)。

是的,伽马分布是最大熵分布,其均值E(X)和平均对数E(logX)是固定的。与所有指数族分布一样,它是固定预期充分统计量的唯一最大熵分布。

要回答有关生成这些分布的物理过程的问题:当 X 的对数呈正态分布时,例如,如果 X 是许多小因素的乘积,则会出现对数正态分布。如果 X 是伽马分布的,则它是许多指数分布变量的总和。例如,泊松过程的许多事件的等待时间。