广义线性模型:为什么我们坚持对均值建模?

机器算法验证 广义线性模型 意思是 造型
2022-03-21 07:14:55

据说 GLM 的标准描述具有三个要素:

  1. 线性预测器η=Xβ
  2. 链接功能g(.)将线性预测变量与结果变量的平均值相关联μ=g1(η)=g1(Xβ)
  3. 结果的分布y用它的意思E(y|X)=μ

有关示例,请参阅Wikipedia和 Gelman 等人的 Bayesian Data Analysis 第 3 版。

我的问题是为什么分布的平均值如此特别。而不是建模E(Y|X)=g1(Xβ),为什么我们不能对分布的其他参数进行建模?那是(other parameters)=g1(Xβ)?

例如,威布尔分布的参数与其均值不对应,但我看到的模型看起来像这样:

yWei(v,λ)ln(λ)=Xβ

作为另一个示例,混合密度网络对混合高斯的参数进行建模。

尽管如此,我读过的每本关于 GLM 的书都说我们对均值建模(|X)=G-1(Xβ). 这让我想知道我错过了一些重要的事情。

1个回答

广义线性模型是线性回归模型的推广。线性回归最小化了拟合回归线的平方误差。最小化平方误差相当于最大化高斯似然。GLM 将这个想法推广到其他分布,因此我们正在估计其他分布的条件均值。

所以这有点像问“有两个轮子的自行车有什么大惊小怪的”,嗯,它们就是这样的车辆。正如其他人在评论中注意到的那样,还有许多其他模型不一定专注于手段。GLM 只是一个模型家族。