机器算法验证 - 为什么 R 在广义线性模型的上下文中将分布族称为“误差分布”？ - 吾爱随笔录

为什么 R 在广义线性模型的上下文中将分布族称为“误差分布”？

机器算法验证 r 可能性分布广义线性模型测量误差

2022-03-11 16:50:48

我想知道为什么 R 在广义线性模型的背景下将分布族称为“误差分布”？拟合模型的正态分布误差（残差）是简单线性回归中的一个关键假设。然而，我的理解是，当这个假设不能满足时，我们切换到广义线性模型，因为它允许响应变量 (Y) 在指数族中遵循非正态分布，这与任何类型的“错误”无关分配”？

1个回答

大概选择这个命名法只是为了在 GLM 和线性回归之间进行类比。您是正确的，该术语并非严格准确，因为为 GLM 选择的分布族实际上并不是模型中“错误”数量的分布。人们可以在 GLM 中构造数量，这些数量本质上是对每个单独观察中的“误差”的度量（最好是偏差残差作为估计量的潜在偏差误差）。虽然这些“错误”的分布受 GLM 中使用的分布族规范的影响，但它们有自己的分布。

其它你可能感兴趣的问题

上一篇使用 R 生成具有零约束的随机正定矩阵下一篇为什么神经网络很难学习恒等函数？