除了@DavidSmith 的回答,一些更正式的术语如下:
广义线性模型调用均值-方差关系作为链接函数的结果。GLM 中没有残差,因为方差只是均值的函数。因此,当我们编写 GLM 时,它的形式为:
g(E[Y|X])=βX
其中是链接函数,项是线性预测变量,转换后的值是拟合值。一般来说,情况是意味着。例如,对于逻辑回归,逆 logit 链接具有很容易将第二个表达式识别为二项式方差。gβXνg−1(βX)E[Y]=g−1(βX)var(Y)=∂∂βg−1(βX)g−1(x)=log(X1−X)g′−1(X)=log(11−X)=g−1(X)(1−g−1(X))
当您写出常见概率模型(如二项式、泊松或指数)的估计方程时,您实际上观察到信息(或方差)取决于均值而不是其他任何东西。顾名思义,这些单参数模型仅使用一个参数(如对数赔率或对数相对率)将预期结果与预测变量的线性组合和相应的链接函数相关联。链接的影响函数(梯度或导数)将均值与方差相关联。
高斯概率模型与二项式(逻辑)模型的不同之处在于它们是2 个参数模型,包括离散项(sigma 或残差)。高斯模型也不同于其他 2 参数模型(如负二项式或 Gamma),因为您可以将残差方差写为模型中的单独项。
基本上,具有正常、独立误差的普通最小二乘法是我所知道的唯一可以实际写入的情况:有意义。y=βX+ϵ
您如何将预期结果与观察到的结果联系起来的更大问题是复杂的。在正常模型中,这是预期和观察到的简单差异以获得残差。在 GLM 中,方差是异方差的,因为均值作为的函数而变化,因此您可以通过除以预期标准误差来标准化每个残差以获得 Pearsonized 残差。X