如何设置仅截距混合逻辑回归以测试与 50% 机会水平的差异?

机器算法验证 物流 混合模式 广义线性模型 lme4-nlme 咕噜咕噜
2022-04-11 08:08:10

在我的实验中,受试者反复必须在 A 和 B 之间做出二元选择,我想测试受试者(作为一个群体)是否有 50% 的机会偏爱 A 而不是 B。有没有办法使用混合逻辑回归,例如glmer()在 R 中?

如果我没记错的话,仅截距模型测试整个受试者是否与零不同。但是,如果我尝试重新编码从属度量,以便每个分数与机会 (0.5) 的差异,然后测试与机会的差异是否不为零,那么模型将不会运行,因为从属度量的值具有为 0 或 1。

有没有其他方法可以做到这一点,glmer()或者我忽略了更直接的方法?它是否取决于构成依赖测量的试验次数?

2个回答

我认为您对截距在逻辑回归中的作用感到困惑。

逻辑回归预测某些结果的概率,在您的情况下,例如 A 选择的概率。为此,它形成了预测变量的线性组合,并将其传递给一个逻辑函数,该函数将实数从 “挤压”到区间。它看起来像这样(来自维基百科的图片):+[0,1]

在此处输入图像描述

因此,如果线性组合的值为 0 ,则逻辑函数的输出为这意味着没有任何预测变量且截距为零的逻辑回归预测 50% 的机会。p=0.5

如果每个主题有 1 个数据点,则可以使用

glm(choice ~ 1, family='binomial')

并查看截距的值和 p 值。在您的情况下,每个主题有超过 1 个数据点,因此您可以使用

glmer(choice ~ 1 + (1|subject), family='binomial')

建议使用二项式检验p=0.5

二项式检验的一种常见用途是零假设是两个类别同样可能发生的情况(例如抛硬币)。可以广泛使用表格来给出这种情况下类别中观察到的显着性观察数量。但是,二项式检验不限于这种情况,可以用于任何概率。

编辑:以上假设每个主题都是“从同一块布上剪下来的”。也就是说,无论是什么,选择 A 或 B 的概率对于每个参与者都是相同的,并且每个 A 或 B 的选择只执行一次。作为一个反例,假设受试者 1 和 2 在 A 和 B 对象之间的选择完全不一致。在后一种假设情况下,我们检测每个受试者即使是完美偏差的能力也会降低,例如,受试者 1 仅选择 B 100 次,而受试者 2 对于仅选择 A 100 次。显然,从那个假设的例子来看,对整体选择缺乏偏见并不等同于缺乏主题偏好。P=0.5

上述问题中的实验及其参与者都没有提供足够的信息来进一步建模。例如,没有呈现衡量一致性的能力或无能力,并且我们完全没有关于被判定为 A 或 B 以及如何发生的上下文。例如,两位法官成对判定脏硬币的 A 面还是 B 面与两位法官判定两堆独立的脏硬币没有重叠的意见是不同的。我们不知道我们是否在询问评委是否有偏见,“A vs B”硬币是否有偏见,以及是否集体或单独。这个问题本身就很复杂,值得单独处理,所以,我在别处把它变成了一个自己的问题。