我从几个角度对这些断言提出异议:
i)虽然规范链接很可能是“有问题的”,但并不立即明显有人会对那个链接感兴趣 - 而例如,泊松中的日志链接通常既方便又自然,因此人们经常对此感兴趣。即便如此,在 Poisson 案例中,人们确实会查看其他链接函数。
所以我们不必将我们的考虑限制在规范链接上。
“有问题的联系”本身并不是反对负二项式回归的特别有力的论据。
例如,在某些负二项式应用中,对数链接似乎是一个相当合理的选择,例如,在数据可能是条件泊松但泊松率存在异质性的情况下 - 对数链接几乎可以解释就像在泊松案中一样。
相比之下,我相当频繁地使用 Gamma GLM,但我不记得(除了教科书示例之外)曾经使用过它的规范链接 - 我几乎总是使用日志链接,因为它是用于解决各种问题的更自然的链接我倾向于一起工作。
ii)“在应用程序中似乎没有做出什么……”在 1989 年可能几乎是真的,但我认为它现在不成立。[即使它现在确实存在,也不是说它是一个糟糕的模型,只是它没有被广泛使用——这可能出于各种原因而发生。]
负二项式回归因其更广泛的可用性而得到更广泛的应用,而且我看到它现在在应用程序中的应用更为广泛。例如,在 R 中,我利用了MASS
支持它的函数(以及相应的书,Venables 和 Ripley's, Modern Applied Statistics with S,在一些有趣的应用程序中使用负二项式回归)——并且我使用了一些功能甚至在我在 R 中使用它之前,在其他一些包中。
如果它对我来说很容易获得,我会更多地甚至更早地使用负二项式回归;我希望许多人也是如此-因此很少使用它的论点似乎更多是一种机会。
虽然可以避免负二项式回归(例如通过使用过度分散的泊松模型),或者在许多情况下你所做的事情并不重要,但有多种原因导致这并不完全令人满意。
例如,当我的兴趣更多的是预测区间而不是系数估计时,系数不变的事实可能不是避免负二项式的充分理由。
当然,还有其他模拟分散的选择(例如您提到的论文主题的 Conway-Maxwell-Poisson);虽然这些当然是选择,但有时我很高兴负二项式作为我的问题的模型是相当好的“拟合”。
所有这些用途和建议都是错误的吗?
我真的不这么认为!如果是的话,现在应该已经相当清楚了。事实上,如果 McCullagh 和 Nelder 继续有同样的感受,他们并不缺乏机会,也不缺乏澄清剩余问题的论坛。Nelder 已经去世(2010 年),但 McCullagh 显然还在。
如果 McCullagh 和 Nelder 的那段短文就是他们所拥有的,我会说这是一个非常薄弱的论点。
这个有问题的链接的后果是什么?
我认为问题主要在于方差函数和链接函数是相关的而不是不相关的(几乎所有其他流行的主要 GLM 系列都是这种情况),这使得解释线性预测器的规模不那么直截了当(这并不是说这是唯一的问题;我确实认为这是从业者的主要问题)。这没什么大不了的。
相比之下,我看到最近 Tweedie 模型被更广泛地使用,而且我没有看到人们对出现在方差函数和规范链接中的事实感到担忧(在大多数情况下甚至不担心关于规范链接)。p
这些都不是要从 Conway-Maxwell-Poisson 模型(Sellers 和 Shmueli 论文的主题)中拿走任何东西,这些模型也越来越广泛使用——我当然不希望参与负二项式 vs COM -泊松射击比赛。
我根本不认为它是一种或另一种,就像(现在更广泛地说)我在统计问题上采取纯粹的贝叶斯或纯粹的频率论立场。在我所处的特定情况下,我会使用任何让我印象深刻的东西作为最佳选择,而每种选择往往都有优点和缺点。