McCullagh & Nelder,第 2 版,第 91 页声称要进行“公平”比较,最好使用通常来自最复杂模型的过度离散参数的单一估计。我注意到在这个SAS 示例中做了同样的事情。Burnham 和 Anderson(第 2 版,第 68 页)也坚持只使用全局模型来估计色散参数,然后将其插入更小的模型中。
有谁知道“公平”是什么意思,为什么重新估计方差参数是不公平的?如果(很可能)最复杂的模型被过度拟合,那么它的偏差太小,这意味着分散参数被低估了。对所有模型使用有偏估计仍然是一个好主意吗?
McCullagh & Nelder (p 127) 承认估计色散参数类似于估计。相应地,我回忆了 Neter 等人(第 4 版,第 342 页)中的类似推理,其中标准。我们建议最大的模型提供“的无偏估计量”,我们应该使用它来评估较小模型的偏差-方差权衡。
对于线性和二项式设置,上述所有作者都同意必须在估计色散参数之前正确获取模型的结构部分。但是,如果我们知道正确的结构部分是什么,就不清楚为什么我们应该继续进行模型选择而不是仅仅使用全局模型。
另一个矛盾是,如果我们想使用 AIC 和类似的标准来选择线性模型,那么我从未听说过使用全局模型估计然后将其插入更小的模型的建议。同样,我还没有听说过在负二项式回归中对分散参数的这种建议。
下面的一些评论表明,问题在于在二项式回归中不是通过 MLE 估计的,但在负二项式回归中它是。那么,只要有一种通过 MLE 估计色散的方法,就没有人会遇到允许色散参数在模型之间变化的问题,反之亦然?例如,如果我们使用威廉姆斯方差函数
其中由 IWLS 估计,那么我们必须对池中的所有模型使用相同的。但是,如果我们应用可以通过 MLE 估计的 Beta-binomial 回归,假设,那么允许在模型之间变化是可以的。这种推理的问题在于 Beta-binomial 是 Williams 方差函数的一个特例,其中。仅仅因为它不是由“纯” MLE 估计的,就不允许的 IWLS 和 MLE 估计无论如何可能很接近,甚至可能是相同的,因为实际上 MLE 通常是通过 IWLS 实现的(例如 R 中的负二项式回归)。