伽玛具有对数正态共享的属性;也就是说,当形状参数保持不变而比例参数变化时(通常在使用任一模型时都会这样做),方差与均方成正比(恒定的变异系数)。
与此类似的情况经常发生在财务数据中,或者实际上,在许多其他类型的数据中。
因此,它通常适用于连续的、正的、右偏斜的数据,并且方差在对数尺度上几乎是恒定的,尽管还有许多其他众所周知的(并且通常相当容易获得)选择特性。
此外,将日志链接与伽马 GLM 拟合是很常见的(使用自然链接相对较少)。与将正态线性模型拟合到数据的对数稍有不同的是,在对数尺度上,伽玛在不同程度上偏斜,而法线(对数正态的对数)是对称的。这使得它(伽玛)在各种情况下都很有用。
我已经在de Jong & Heller和Frees以及大量论文中看到了伽马 GLM 的实际用途(带有真实数据示例);我还看到了其他领域的应用。哦,如果我没记错的话,Venables 和 Ripley 的 MASS将它用于学校旷课(quine 数据;编辑:原来它实际上是在MASS 的 Statistics Complements 中,见 p11,pdf 的第 14 页,它有一个日志链接,但是DV有一个小的变化)。呃,McCullagh 和 Nelder 做了一个血液凝固的例子,尽管它可能是自然的联系。
然后是Faraway 的书,其中他做了一个汽车保险示例和一个半导体制造数据示例。
选择这两个选项中的任何一个都有一些优点和一些缺点。由于现在两者都很容易适应;这通常是选择最合适的问题。
这远非唯一的选择。例如,还有逆高斯 GLM,它比伽马或对数正态更偏斜/更重尾(甚至更异方差)。
至于缺点,预测区间更难。一些诊断显示更难解释。在线性预测器的尺度(通常是对数尺度)上计算期望值比等效对数正态模型更难。假设检验和区间通常是渐近的。这些通常是相对较小的问题。
它比对数链接对数正态回归(取对数并拟合普通线性回归模型)具有一些优势;一是平均预测很容易。