这个问题与为您的广义线性模型选择链接函数有关。McCullagh 和 Nelder说(第 31 页):
链接函数与线性预测器相关η到期望值μ一个基准的[结果值]是的.
链接函数使其成为广义线性模型。隐藏在您的调用中glmer.nb()的是日志链接功能的默认选择。也就是说,您正在(可能不知道)使用线性预测器对期望值的对数进行建模。等效地,通过对线性预测变量求幂来找到feeding的期望值。feeding
以您编写模型的方式,线性预测器的固定效应部分*将是:β0+β1 inf_cat+ total_inf_cat. 这里,β0是截距,β1是 的回归系数inf_cat,偏移量将 的系数限制为total_inf_cat1。因此,按照您编写模型的方式,每增加 1 个单位total_inf_cat就会给您efeeding-倍增。
就您对主题的理解而言,这是否有意义?可能不是,如果您认为这total_inf_cat是总可用持续时间并且数量feeding应该与 成正比total_inf_cat,其他条件相同。那么日志链接应该伴随一个偏移量log(total_inf_cat), 以保持直接的比例关系。
负二项式模型还有其他链接函数选择,平方根和恒等链接也可用于glmer.nb(). 正如 Demetri Pananos 在另一个答案中所说,如果您确实选择了不同的链接函数,则必须选择不同的偏移量以保持 和 之间的feeding比例total_inf_cat。例如,total_inf_cat如果您在调用glmer.nb(). 此页面及其链接讨论了这些选择。对于计数数据,日志链接通常最有意义。
最后,负二项式模型最适用于方差大于泊松模型预期的计数数据,其中方差必然等于均值。如果feeding是一个连续变量(喂食所花费的时间),那么使用不同类型的模型可能会更好。但是对于任何类型的广义线性模型,选择偏移量以提供与链接函数相结合的所需行为的相同原则仍然成立。
*我假设它female代表一组母亲的 ID。然后(1|female)模型的随机效应部分允许不同的个体有不同的截距值。