我正在分析柑橘花病的 3 个田间试验(农场 = 3)的数据:响应变量是二项式的,因为花只能生病或健康。
我对比较 5 种杀菌剂喷洒系统(trt=5)特别感兴趣。我对特定农场的效果不感兴趣,它们只是代表我想建议最佳治疗方法的地区的农场总数。
每个农场有 4 个街区(bk=4),包括 2 棵树作为子样本(tree=2),我在其中评估了 100 朵花。
这是数据的快速浏览:
dinc <- within(dinc, { tree_id <- as.factor(interaction(farm, trt, bk, tree)) })
farm trt bk tree dis tot tree_id
<fctr> <fctr> <fctr> <fctr><int> <int> <fctr>
iaras Calendar 1 1 0 100 iaras.Calendar.1.1
iaras Calendar 1 2 1 100 iaras.Calendar.1.2
iaras Calendar 2 1 1 100 iaras.Calendar.2.1
iaras Calendar 2 2 3 100 iaras.Calendar.2.2
我考虑的模型是:
resp <- with(df, cbind(dis, tot-dis))
m1 = glmer(resp ~ trt + (1|farm/bk) , family = binomial, data=df)
我使用GLMM 页面中的 overdisp_fun() 测试了过度分散
chisq ratio p logp
4.191645e+02 3.742540e+00 4.804126e-37 -8.362617e+01
由于比率(残差 dev/residual df)> 1,并且 p 值 < 0.05,我考虑添加观察水平随机效应(链接)来处理过度离散。
所以现在为模型中的每一行(tree_id)添加了一个随机效果,但我不确定如何包含它。这是我的方法:
m2 = glmer(resp ~ trt + (1|farm/bk) + (1|tree_id), family = binomial, data=df)
我也想知道是否farm应该是固定效果,因为它只有3个级别......
m3 = glmer(resp ~ trt * farm + (1|farm:bk) + (1|tree_id), family = binomial, data=df)
我非常感谢您对我的型号规格的建议...
