重新参数化心理测量数据的二项式链接

机器算法验证 混合模式 二项分布 心理测量学
2022-04-07 14:31:58

考虑一个实验,一个正方形和菱形出现在屏幕上,一个在另一个之前,参与者需要判断哪个先出现。操纵两个形状之间的时间间隔并对响应进行平均以获得参与者响应“正方形优先”的概率通常会产生 s 形曲线,例如:

在此处输入图像描述

现在,我知道对多个参与者中每个参与者中的比例的平均响应是一个坏主意,所以我想我想使用一个广义混合效应模型来分析来自这些实验的数据,该模型具有一个链接函数,可以识别原始响应的二项式性质数据。但是,我发现 logit 和 probit 链接不令人满意,因为它们具有斜率+截距参数化,混淆了具有独立心理测量兴趣的曲线属性。具体来说,虽然斜率确实是一个感兴趣的参数(因为它指示感知灵敏度),但截距不是。比截距更有趣的是曲线的移动,通常由曲线到达 p("square first")=.5 的 x 轴上的点作为索引。

为了详细说明,考虑上述相关实验的扩展,其中有三组参与者:

  1. 没有分心的“控制”组,“方形优先”和“钻石优先”试验比例相等
  2. 听着令人分心的音乐的“分心”群体
  3. 一个“有偏见”的群体,他们经历了更多的“方形优先”试验而不是“钻石优先”试验

据推测,对照组和分心组的斜率应该不同,通过以下方式评估:

#fit a model that contains no group-by-slope interaction
m1 = lmer(
    response ~ (1|participant) + interval + group
    , family = binomial
    , REML = FALSE
)
#fit a model that contains the groups-by-slope interaction
m2 = lmer(
    response ~ (1|participant) + interval*group
    , family = binomial
    , REML = FALSE
)
(AIC(m1)-AIC(m2)) #AIC-corrected log-base-e likelihood ratio

此外,据推测,有偏的组在函数转换上会与其他组不同。如果我愿意假设这些组在斜率方面没有差异,那么可以通过评估组对截距的影响以与上述类似的方式评估偏移:

#fit a model with no group effect on the intercept
m3 = lmer(
    response ~ (1|participant) + 1
    , family = binomial
    , REML = FALSE
)
#fit a model with a group effect on the intercept
m4 = lmer(
    response ~ (1|participant) + group
    , family = binomial
    , REML = FALSE
)
(AIC(m1)-AIC(m2)) #AIC-corrected log-base-e likelihood ratio

但是,如果您不能假设斜率也不受预测变量的影响,那么这种评估班次影响的方法就会失效。当然,您可以如上所述评估对斜率没有影响的假设,但这不仅会使您在发现对斜率的影响时陷入困境而且容易受到对其他假设检验方法的相同批评。最后,即使假设斜率相等,也可能是平均斜率相等的假设;斜率的可变性将导致截距分析作为移位的代理相对于移位的直接分析具有较低的功效(因为截距的方差将代表斜率和移位的组合方差) .

所以,我的问题是:

  1. 是否有一个链接函数可以处理二项式数据,同时还实现斜率+移位参数化?
  2. 如果对#1 的回答为“是”,那么关于如何编写这样的链接函数的任何建议?我知道如何在单个实验条件下给定单个参与者跨时间间隔的响应数据编写 MLE 搜索,但我不确定如何将其扩展到可用于分析跨个体和条件组的数据的链接函数.

PS我知道,给定斜率和截距参数值的一组最大似然估计,计算移位值的ML估计只是一个算术问题。然而,这并不适用,因为它不能应用于上述推理过程。

2个回答

您的问题实际上不是链接函数,而是线性预测器的参数化。而不是拥有α+βx, 你想拥有β(xδ). 这里δ将是您感兴趣的“移位”参数。虽然两者在数学上是等价的(α=βδ),它们在统计上并不等价。实际上,第二个参数化的参数不是线性的,因此无法拟合线性模型(无论是否泛化)。

这也提出了解决方案:您必须使用广义非线性混合模型。在R中,可以使用包的nlmer功能。lme4设置线性模型需要更多的工作,但应该是可行的。

对于简单的设计,一种解决方案可能是基于一种条件的 psu 居中。您可以对一个条件进行初始模型,获取 pss,重新计算所有数据,现在您的截距将反映 pss 的变化。

当有交互时,你仍然会遇到一个严重的问题......但是某个地方的一些问题是不可避免的。