我认为这些响应都不完全适合任何标准 GLM 链接功能。采取务实的方法,选择一个广泛做正确事情的链接功能可能就足够了。
您的原始数据来自多项分布,丰富度,R, 是得分为 1 或更高的类别数。虽然这是计数数据,但它与普通的计数数据并不完全相同。最显着的区别是您永远不能计数为零。作为务实的第一次尝试,我会考虑建模(R−1)使用泊松链接函数。这里的手动推理可能是这样的:如果您在固定的时间内以随机速率捕获动物,则捕获的数量将由 Poisson 很好地建模。您正在捕捉固定数量的动物,但动物的类型会随机变化。如果不是你已经看到物种回归的事实,这将是一个很好的匹配。
对于多样性,事情就更不直观了。然而,多样性是丰度的一种平均值(pi) 的每个物种,因此受[0,1]. 这表明您可以将其视为比例并使用 logit 链接函数。
高级替代方案
如果支持和“看起来大致正确”方法的务实匹配不令人满意,似乎还有另一种方法。我对此知之甚少,但有一种叫做“*多项式多样性模型”的东西,它旨在处理这类问题。它在这篇论文中有所描述,http://www.ncbi.nlm.nih。 gov/pubmed/23185889但我不知道它有多受欢迎。
然而,它在 R 中实现并且在 CRAN 上可用MRM,显然是上述论文的作者。它包括一个在帮助中用作示例的蜘蛛数据集:
library(MDM)
data(spider6)
fit0 <- mdm(y2p(spider6[,1:6])~1,data=spider6)
fit1 <- mdm(y2p(spider6[,1:6])~Water,data=spider6)
fit2 <- mdm(y2p(spider6[,1:6])~Water+Herbs,data=spider6)
fit3 <- mdm(y2p(spider6[,1:6])~Site,data=spider6,alpha=TRUE)
anova(fit0,fit1,fit2,fit3)