迭代重新加权最小二乘 - 权重混淆

机器算法验证 回归 物流 二项分布 加权回归 爱尔兰人
2022-04-14 13:30:23

在执行迭代重加权最小二乘法 (IRLS) 以导出β^逻辑回归的估计,我在网上阅读的所有资源都说使用与每个变量的方差成反比的权重Yi. 例如,请参见下面的第 4 步(取自此处):

在此处输入图像描述

然而,在我在网上找到的 IRLS 的 R 代码实现中,权重被设置为方差,而不是方差的倒数(例如herehere)。

例如,请参见下图。它设置s = mu * (1 - mu),这是给定的方差Y在逻辑回归中具有伯努利分布。因此,当计算权重矩阵 , 时S,不应该S = diag(1/s)代替S = diag(s)吗?我在这里想念什么?

在此处输入图像描述

澄清这一点将非常有帮助。我知道对于加权最小二乘,wi=1σi2是标准的,那么为什么 IRLS 实现中的权重矩阵不会反转方差?

1个回答

广义线性模型的 IWLS 算法不同于异方差线性模型的算法,因为它考虑了两件事:

  • 非线性链接函数
  • 方差-均值关系

似然分数方程看起来像

dμdβ1V(μ)(Yμ)=0
因此,正如您所料,方差在分母中。我们可以展开dμ/dβ
dηdβdμdη1V(μ)(Yμ)=0
dη/dβ只是XT, 所以
XTdμdη1V(μ)(Yμ)=0

我们要定义一个新的响应变量Z和权重变量W使得 WLS 方程

XTW(ZXβ)=0
匹配似然方程。这是用

  • 工作反应 Z=(YXβ)dηdμ,这是变换的一阶近似Y带链接功能
  • 工作重量 W=(dμdη)21V(μ)

请注意,方差仍在分母中。然而,对于每个分布的所谓规范链接函数,碰巧dμ/dη=V(μ)并且工作重量等于V(μ)2V(μ)1=V(μ). 也就是说,看起来好像已经将方差放在了分子中。

通过查看非规范链接的 IWLS 算法(例如二项式或泊松模型的恒等链接),您可以看到分母中的方差确实存在,其中dμ/dη=1.