决定使用哪种模型处理计数数据的适当策略是什么?我已经计算了需要建模为多级模型的数据,并且(在此站点上)向我建议最好的方法是通过错误或 MCMCglmm。但是我仍在尝试学习贝叶斯统计,我认为我应该首先尝试将我的数据拟合为广义线性模型并忽略数据的嵌套结构(这样我才能对预期的结果有一个模糊的概念)。
大约 70% 的数据为 0,方差与均值的比率为 33。因此数据非常分散。
在尝试了许多不同的选项(包括泊松、负二项式、准和零膨胀模型)之后,我发现结果的一致性非常低(从一切都重要到没有重要意义)。
我如何才能根据 0 通货膨胀和过度分散做出明智的决定来选择哪种类型的模型?例如,我怎么能推断出准泊松比负二项式更合适(反之亦然),我怎么知道使用任何一个已经充分(或没有)处理多余的零?同样,如果使用零膨胀模型,我如何评估不再存在过度分散?或者我应该如何在零膨胀泊松和零膨胀负二项式之间做出决定?