在线性或广义混合效应模型之间进行选择,最重要的是要考虑什么?

机器算法验证 混合模式 广义线性模型 lme4-nlme 二项分布 咕噜咕噜
2022-04-18 14:25:29

线性混合效应模型适用于连续变量。广义的是非连续的,例如二项式。

我们有一个任务,受试者可以让每个项目正确或不正确。我会说这至少在学科水平上是二项式的。

团队的其他成员说,做出这个决定最重要的是研究问题,即“在每次测试中,他们将在 0 中正确的项目有多少”,并建议将变量视为连续变量并使用线性模型.

此外,我们得到了很多 0(在 3 个测试的最后一个中几乎 80%),所以也许我们甚至不应该使用二项式,而是零膨胀二项式。如果我们决定将brms包用于 R,这将很重要。同时,我们将使用lme4.

你怎么看?

2个回答

线性混合效应模型适用于连续变量。广义的是非连续的,例如二项式。

这不是真的。有关广义线性模型,请参见wiki 页面例如,伽玛和指数分布是广义线性模型,并且都是连续的。不同之处在于您允许使用广义线性模型的正态分布以外的其他分布。

我们有一个任务,受试者可以让每个项目正确或不正确。我会说这至少在学科水平上是二项式的。

是的,这是二项式数据。

团队的其他成员说,做出这个决定最重要的事情是研究问题,即“每次测试中有多少项目会正确”,并建议将变量视为连续变量并使用线性模型.

我假设你有固定数量的ni每个主题的试验i. 在这种情况下,它是一个可以有价值的分数0,1/ni,2/ni,,1. 因此,您应该使用Dimitris Rizopoulos所写的二项式分布。

此外,我们得到了很多 0(在 3 个测试的最后一个中几乎 80%),所以也许我们甚至不应该使用二项式,而是零膨胀二项式。如果我们决定为 R 使用 brms 包,这将很重要。

据我所知,你有一些科目,k,每个人都会做出一些猜测,n1,,nk. 然后你建模E(yi/ni)在哪里yi是来自主题的正确猜测的数量i. 假设您没有协变量,那么具有随机效应的模型可能是

g(E(yi/ni))=μ+ϵi,ϵiN(0,σ2)

在哪里g是一个链接函数(例如,logit),μ是当随机效应为零时受试者猜测正确的概率的 logit,并且ϵi是主题的随机效应i. 请注意,这个模型很容易产生“很多零”,如果μ足够小,您使用 logit 链接功能。因此,在这种情况下,很多零可能不是使用零膨胀二项式的好论据。

N 次试验的成功次数是二项分布。因此,您似乎应该进行混合效应逻辑回归。