在使用主题内实验对实验研究中的计数数据进行建模时,我遇到了许多实际问题。我简要描述了实验、数据以及到目前为止我所做的事情,然后是我的问题。
依次向受访者样本展示了四部不同的电影。在每部电影之后进行一次采访,我们计算了对 RQ(预测计数变量)感兴趣的某些陈述的出现次数。我们还记录了可能出现的最大数量(编码单元;偏移变量)。此外,电影的几个特征是在连续尺度上测量的,其中一个我们有一个因果假设,即电影特征对语句计数的影响,而其他是控制(预测变量)。
目前采用的建模策略如下:
估计随机效应泊松模型,其中因果变量用作协变量,其他变量用作控制协变量。该模型的偏移量等于“log(units)”(编码单位)。随机效应是跨主题进行的(特定于电影的计数嵌套在主题中)。我们发现因果假设得到证实(sig. 因果变量系数)。估计我们在 R 中使用了 lme4 包,特别是函数 glmer。
现在我有以下问题。泊松回归中的一个常见问题是过度分散。我知道这可以通过使用负二项式回归并评估其分散参数是否改善简单泊松模型的模型拟合来测试。但是,我不知道如何在随机效果环境中这样做。
- 在我的情况下,我应该如何测试过度分散?我在我知道如何拟合的简单泊松/负二项式回归(没有随机效应)中测试了过度分散。该测试表明存在过度分散。然而,由于这些模型没有考虑聚类,我认为这个测试是不正确的。此外,我不确定偏移量在过度分散测试中的作用。
- 是否有类似负二项式随机效应回归模型的东西,我应该如何将它拟合到 R 中?
- 您对我应该在数据上尝试的替代模型有建议吗,即考虑重复测量结构、计数变量和暴露(编码单位)?