GLM 是否有等效的引导程序“重新采样残差”?

机器算法验证 广义线性模型 引导程序 残差 重采样
2022-04-14 04:12:59

在线性回归中,我读过通过“重新采样残差(错误)”来完成非参数引导。一般的想法是您通过残差的模拟值扰乱平均响应,并将这些扰动值作为您的重新采样。

我想知道广义线性模型(GLM)是否有任何等效的方法。

由于没有立即将误差项合并到线性预测器中,因此我看不出这是如何完成的。我能想到的最接近的等价物是在线性预测器中添加一定程度的高斯噪声——但这似乎足以用另一个名字来命名(如果完全采用这种方法的话)。

具体来说,我很好奇:

  1. 是否在 GLM 设置中完成“重新采样残差”,如果是,这种方法通常称为其他名称吗?
  2. 在这种情况下应用这种方法的例子(例如,引用期刊文章、书籍等;理想的是那些讨论这种方法的优点和缺点的材料)。
1个回答

是的。

如果您不使用误差项而是将线性回归视为条件分布的模型,则概括是最清楚的YX

YXNormal(Xβ,σ)

当使用参数引导时,我们可以想到我们的新yi的作为来自这些条件分布的样本,每个对应一个xi.

这直接推广到广义线性模型。例如,逻辑回归:

YXBernoulli(p=11+eXβ)

或泊松回归:

YXPoisson(λ=eXβ)

在每种情况下,参数引导程序都是相同的,我们采样一个新的yi从估计的条件分布Yxi.

在线性回归的情况下,这在数学上等同于从误差分布中采样,然后添加到线性预测变量上,但是这种误差项分布无法推广到线性回归情况(而且,我认为,这会导致错误线性回归的术语描述略逊于条件分布描述)。