具有二项式但不具有准二项式族的 glm 的完美分离错误消息

机器算法验证 回归 物流 二项分布 分离 准可能性
2022-04-13 13:21:13

我正在尝试创建一个模型,查看年龄、补充食物使用和筑巢日期(转换为儒略日)对女性生殖成功(成功 = 1 和失败 = 0)的影响。不幸的是,我的样本量非常小,只有 17 个人。我相信我的数据确实包括完美的分离,因为使用补充食物的大多数(八名中的七名)女性在特定日期之前开始筑巢,而大多数不使用补充食物的个体(九名中的七名)在之后开始那个日期。这会阻止我对我的数据进行逻辑回归吗?

当我使用 glm 函数运行回归并将族指定为二项式时,我收到了错误消息,warning message: glm.fit: fitted possibilities numerically 0 or 1 occurred但当我将族指定为准二项式时却没有。拟二项式的使用是否以某种方式解释了完美分离,或者这是解释我的数据过度分散的意外副作用?

此外,当我比较两个模型的结果时,我使用的模型family = binomial会产生非统计显着的结果(z 值为 0,p 值为 1),而我使用的模型family = quasibinomial会为所有变量产生统计显着的结果。

1个回答

这听起来很奇怪,我猜这是一个数字巧合。二项式和拟二项式族的 R 的 glm 的唯一区别在于标准误的计算,估计过程完全相同。或者,可能是标准误差计算的不同导致了宣布收敛的标准不同。无论如何,您不应该相信假设检验的模型,标准误差(对于二项式和准二项式情况)是虚假的。在这里查看我的答案为什么当类分离良好时逻辑回归变得不稳定? 对于在这种分离情况下该怎么做的一些想法。