我希望有人可以帮助解决我认为相对简单的问题,我想我知道答案,但没有确认它已成为我无法确定的事情。
我有一些计数数据作为响应变量,我想测量该变量如何随某物的比例存在而变化。
更详细地说,响应变量是在多个站点中存在的昆虫物种的计数,例如,一个站点被采样 10 次,该物种可能出现 4 次。
我想看看这是否与这些地点的整个植物群落中一组植物物种的比例存在相关。
这意味着我的数据如下所示(这只是一个示例)
Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence
1, 5, 10, 0.5
2, 3, 10, 0.3
3, 7, 9, 0.6
4, 0, 9, 0.1
数据还包括位置的随机效应。
我想到了两种方法,一种是线性模型(lmer
),将昆虫转换为比例,例如
lmer.model<-lmer(insectCount/NumberOfInsectSamples~
ProportionalPlantGroupPresence+(1|Location),data=Data)
第二个是二项式 GLMM ( glmer
) 例如
glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~
ProportionalPlantGroupPresence+(1|Location),
data=Data,family="binomial")
我相信二项式 glmer 是正确的方法,但是它们会产生相当不同的结果。我似乎无法在网上找到明确的答案,但仍然感到有点不确定,并希望确保我没有犯错。
任何帮助或对此替代方法的见解将不胜感激。