我有一个渔业数据集,我已经为地图上的每个网格单元计算了值。该值是该单元格中每个月/年的总捕鱼组的比例。因此,我的值介于 0-1 之间,但不包括 0 和 1(范围实际上非常偏斜,为:0.0005347594 到 0.1933216169)。我感兴趣的是随着时间的推移,靠近特定位置的钓鱼组的比例是否更高。
我已经读过有两种方法可以做到这一点——要么是带有二项式族和 logit 链接的 GLM,要么是 beta 回归。
我在 R 中尝试了这两种方法:
二项式 GLM:
m1 <- glm(PercentTotalSets ~ factor(SetYear) + DayLength + DistTZCF + DistNWHI,
family = binomial(link='logit'), data = Totals_CellId)
测试版:
BetaGLM <- betareg(PercentTotalSets ~ factor(SetYear) + DayLength + DistTZCF + DistNWHI,
data = Totals_CellId )
使用二项式 GLM,我得到的结果与我运行具有 gamma 分布的 GLM 时的结果非常不同(例如,DistNWHI
在 p 值为 0.9 的情况下不显着,而在它显着之前)。通过 beta 回归,我得到了与具有伽马分布的 GLM 非常相似的结果(例如,DistNWHI
具有相似 p 值的显着性)。
我认为 beta 回归是正确的方法,因为我没有 0 或 1,我需要设置界限,但我不确定这是否正确。
我会很感激任何和所有的建议。