为什么在线性模型中使用正态分布,而在广义线性模型中使用指数分布?

机器算法验证 回归 分布 广义线性模型
2022-03-17 02:55:11

为什么在线性模型中使用正态分布,而在广义线性模型 (GLM) 中使用指数分布?

2个回答

在 GLM 中,指数分布族(不是指数分布,https://en.wikipedia.org/wiki/Exponential_family)用于对各种结果进行建模,真实连续变量的高斯(或正态)分布,伽玛分布实数正连续变量、离散变量的二项分布等。

普通的线性模型只是分布选择中的一种,它使用正态分布。

一个普通的线性模型——使用正态分布——只是一个用于一个目的的 GLM。其他用途建议其他分布。并非所有广义线性模型 (GLM) 都使用指数分布。

术语也令人困惑:在诸如“广义线性模型使用指数分布”之类的语句的上下文中,“指数分布”是指“指数分布之一不是指数分布

GLM使用指数分布族之一来模拟各种结果:

利用 领域 多变的 分配
线性响应 所有的真实 连续的 高斯(正常)
尺度参数 正数 连续的 伽玛
二进制结果计数 整数 离散的 二项式

... 等等; 例如,参见 Wikipedia 上的GLM 链接函数表