广义线性混合模型:诊断

机器算法验证 混合模式 异常值 咕噜咕噜 厨师距离
2022-03-23 04:18:00

我有一个随机截距逻辑回归(由于重复测量),我想做一些诊断,特别是关于异常值和有影响的观察。

我查看了残差,看看是否有突出的观察结果。但我也想看看库克的距离或 DFFITS 之类的东西。Hosmer 和 Lemeshow (2000) 说,由于缺乏相关数据的模型诊断工具,人们应该只拟合一个忽略相关性的常规逻辑回归模型,并使用可用于常规逻辑回归的诊断工具。他们认为这比根本不做诊断要好。

这本书是 2000 年的,我想知道现在是否有可用的方法用于具有混合效应逻辑回归的模型诊断?检查异常值的好方法是什么?

编辑(2013 年 11 月 5 日):

由于缺乏响应,我想知道是否通常不使用混合模型进行诊断,或者在建模数据时不是一个重要的步骤。所以让我重新提出我的问题:一旦你找到了一个“好的”回归模型,你会怎么做?

2个回答

广义线性混合模型的诊断方法确实不同。我看到的一个基于 GLMM 残差的合理方法是由 Pan and Lin (2005, DOI: 10.1111/j.1541-0420.2005.00365.x)。他们一直在使用残差的累积和,其中排序由解释变量或线性预测器强加,从而测试给定预测器的函数形式的规范或整个链接函数。零分布基于来自正确规范的零分布的设计空间的模拟,并且它们展示了该测试的良好尺寸和功率特性。他们没有具体讨论异常值,但我可以想象,异常值可能至少应该通过将链接函数过度弯曲到有影响的观察结果来摆脱链接函数。

对于查看混合模型诊断的最佳方法是什么,有很多不同的意见。通常,您需要同时查看残差和标准方面,这些方面将针对非重复测量模型进行检查。

除此之外,通常,您还需要查看随机效应本身。方法通常涉及通过各种协变量绘制随机效应,并在随机效应分布中寻找非正态性。还有更多方法(一些在之前的评论中提到过),但这通常是一个好的开始。