我想将平均菌落大小建模为捕食者密度的函数。在每个处理级别中,较小的菌落(3-5 个人)比大型菌落(多达 600 个人)更常见。我应该使用哪种错误分布?
如果我的响应变量是菌落大小,我应该使用哪种 GLM?
没有足够的信息来提供明确的答案。
我收集到的菌落大小将是一个计数(而不是说一个区域或一个质量)。
最好不要将它们视为代表错误项,而应将其视为响应的条件分布。
一些可能的模型包括负二项式或对数系列分布——这是指数族中的两个分布,可能适用于此类计数,尽管它们不是唯一的可能性(必须注意零情况;例如GLM 中使用的负二项式从 0 开始,但菌落大小可能以 1 为界。
在某些情况下,您可能可以从泊松中获得一些用处,但我预计它通常不会偏斜。
(日志系列分布可能无法在大多数软件中实现。)
您可能需要考虑更复杂的模型,即直指数族。您可能需要考虑截断或移位的分布,或者如果可能为零,则可能是零膨胀或障碍模型;例如,您可能还需要混合效果 GLM。
关于转换,请参见:
O'Hara、Robert B. 和 D. Johan Kotze。2010. «不要对计数数据进行对数转换»。生态学与进化方法 1 (2): 118-22。doi:10.1111/j.2041-210X.2010.00021.x。
概括 :
1. 生态计数数据(例如个体或物种的数量)通常进行对数转换以满足参数测试假设。
2. 除了广义线性模型更适合处理计数数据这一事实之外,计数的对数变换在如何处理零观测值方面存在额外的难题。只有一个零观测值(如果这个观测值代表一个采样单元),整个数据集需要通过在转换之前添加一个值(通常为 1)来伪造。
3. 模拟负二项式分布的数据,我们比较了以各种方式(对数、平方根)转换的拟合模型的结果与使用准泊松和负二项式模型拟合未转换计数数据的模型的结果。
4. 我们发现转换效果很差,除了离散度较小且平均计数较大时。准泊松模型和负二项模型始终表现良好,几乎没有偏差。
5. 我们建议不要通过对数转换来分析计数数据,而应使用基于泊松和负二项分布的模型。
