我想知道为什么 R 在广义线性模型的背景下将分布族称为“误差分布”?拟合模型的正态分布误差(残差)是简单线性回归中的一个关键假设。然而,我的理解是,当这个假设不能满足时,我们切换到广义线性模型,因为它允许响应变量 (Y) 在指数族中遵循非正态分布,这与任何类型的“错误”无关分配”?
为什么 R 在广义线性模型的上下文中将分布族称为“误差分布”?
机器算法验证
r
可能性
分布
广义线性模型
测量误差
2022-03-11 16:50:48
1个回答
大概选择这个命名法只是为了在 GLM 和线性回归之间进行类比。您是正确的,该术语并非严格准确,因为为 GLM 选择的分布族实际上并不是模型中“错误”数量的分布。人们可以在 GLM 中构造数量,这些数量本质上是对每个单独观察中的“误差”的度量(最好是偏差残差作为估计量的潜在偏差误差)。虽然这些“错误”的分布受 GLM 中使用的分布族规范的影响,但它们有自己的分布。
其它你可能感兴趣的问题