我从一个实验中收集了数据,在该实验中,我向一个人展示了四个视频之一condition(prediction我要求每个人在观看完 25%、50%、75% 和 100% 的视频后做出预测 ( completed)。我总共收集了 330 个回复。
从更技术的角度来看,我有一个包含两个自变量和一个因变量的数据集。condition是分类的,在主题之间测量了 4 个级别;completion是具有 4 个级别的序数(尽管基础结构是连续的 - 我应该将其建模为连续变量吗?)并在受试者内测量。因变量prediction是具有 3 个级别的分类变量。我可以把它变成二分法,因为我对正确的预测有基本事实,所以我可以把它编码为correct/incorrect.
我的假设是,随着时间的推移,正确预测的斜率在条件之间存在显着差异,即,对于某些视频,与其他视频相比,人们更早做出更好的预测。
由于这是使用分类因变量的重复测量实验,因此我使用广义线性混合效应模型(glmer在 R 中)来拟合我的数据。以下是我目前正在拟合的模型:
interaction <- glmer("prediction ~ condition*completion + (1|id)", data=data, family="binomial")
main_effects <- glmer("prediction ~ condition + completion + (1|id)", data=data, family="binomial")
baseline <- glmer("prediction ~ completion + (1|id)", data=data, family="binomial")
然后我比较main_effects和使用. 我真的像这样测试我的假设吗?(我仍然很容易与线性模型混淆)baselineinteractionmain_effectsanova()
但是,我的主要问题是:我收到错误:boundary (singular) fit: see ?isSingular, formain_effects和interaction。我是否将其正确解释为:数据不支持参与者作为随机因素,而我应该适合glm?