这类问题的正确分析是什么?(条件逻辑回归?)

机器算法验证 假设检验 物流 多重比较 配对数据
2022-03-24 06:56:53

给定以下实验,回答以下问题的正确统计方法是什么:

参与者连续显示图片,并要求在每张图片后回答她是否看到了物体或脸。在每次试验(图片展示)中,展示的图片(210 个单独的人脸中的 1 个或 210 个单独的对象中的 1 个)叠加一定量的随机噪声(在 5% 和 98% 之间)。每个试验中呈现的图片都比较小,因此每个试验也有一个背景。背景可以是黑色、大物体或大脸。单张图片匹配,即每张单张图片共呈现3次,黑色背景1次,大物体背景1次,大脸背景1次。叠加在单个图片上的随机噪声量在 3 种不同的背景条件下保持不变。大物体背景中的物体没有变化,也不包含在所呈现的 210 个单独的物体图片之一中。同样,大人脸背景中的人脸也没有变化,也没有包含在所呈现的 210 张个人人脸图片中的一张中。没有噪音被添加到任何背景中。

我想回答的问题是,在 3 种不同的背景条件下,对面部、物体或两者的感知是否存在显着差异。 有关我想回答的问题的更多详细信息,请参阅下面的问题 5

所以最后,我有一个数据表,如下所示:

+-------------+-------------+--------------+------- ------+--------------+--------------+
| 参与者 | 类别 | 图片ID | 噪音水平 | 背景 | 回应* |
+-------------+-------------+--------------+------- ------+--------------+--------------+
| 1 | 0 | 1 | 5% | 1 | 0 |
| 1 | 0 | 1 | 5% | 2 | 0 |
| 1 | 0 | 1 | 5% | 3 | 0 |
| | | | | | |
| 1 | 0 | 2 | 24% | 1 | 0 |
| 1 | 0 | 2 | 24% | 2 | 1 |
| 1 | 0 | 2 | 24% | 3 | 0 |
| | | | | | |
| 1 | 0 | 3 | 80% | 1 | 1 |
| 1 | 0 | 3 | 80% | 2 | 0 |
| 1 | 0 | 3 | 80% | 3 | 1 |
| | | | | | |
| .. | .. | .. | .. | .. | .. |
+-------------+-------------+--------------+------- ------+--------------+--------------+
| 1 | 1 | 211 | 12% | 1 | 1 |
| 1 | 1 | 211 | 12% | 2 | 1 |
| 1 | 1 | 211 | 12% | 3 | 1 |
| | | | | | |
| 1 | 1 | 212 | 20% | 1 | 1 |
| 1 | 1 | 212 | 20% | 2 | 0 |
| 1 | 1 | 212 | 20% | 3 | 1 |
| | | | | | |
| 1 | 1 | 213 | 75% | 1 | 0 |
| 1 | 1 | 213 | 75% | 2 | 0 |
| 1 | 1 | 213 | 75% | 3 | 1 |
| | | | | | |
| .. | .. | .. | .. | .. | .. |
+-------------+-------------+--------------+------- ------+--------------+--------------+

其中类别是面 (0) 或对象 (1),响应也是面 (0) 或对象 (1)。参与者的反应是因变量。具有基本连续体的二分法。由于每个参与者都在所有 3 个背景条件下进行测量,因此它是一个依赖设计。因为,对于一张单独的图片,我在 3 个背景条件下保持噪声不变,它以某种方式配对或匹配。

首先,我考虑计算双列相关性并根据 t 统计量比较它们,但后来我看到逻辑回归似乎更适合我的数据结构。但我还是觉得应该以某种方式将匹配样本和依赖设计纳入分析。所以当我搜索它时,会弹出条件逻辑回归。

问题是,在条件逻辑回归中,匹配是在因变量上完成的。它们通常将因变量中的 1 与一个或多个 0 样本相匹配。我没有匹配因变量,而是匹配自变量(在每个背景条件下具有相同噪声水平的相同图片)。所以我认为我不能对这些数据使用条件逻辑回归,但我找不到其他合适的东西。

有更多统计经验的人可以向我解释回答上述问题的正确方法是什么,无论是对面部、物体还是两者的感知在 3 种不同背景条件之间是否存在显着差异。

谢谢您的帮助。

[实验过程]

该实验共有 1260 次试验。由 210 个单独的面孔和 210 个单独的对象组成,每个对象呈现 3 次(3 种不同背景中的每一种都出现一次)。试验顺序是随机的,其约束条件是在 420 次试验的第一个、第二个和最后一个块中,每个背景恰好呈现 140 次,每个单独的对象和每个单独的面孔只呈现一次。大多数但不是所有不同的人脸和对象都添加了不同数量的噪声,但单个人脸或对象的噪声在其呈现的 3 种不同背景条件下保持不变。

[问题和答案]

1.有多少参与者?共有5名参与者。

2.噪音有界限吗?噪声以 0.5% 的步长在 [5%, 98%] 范围内离散化。噪声是从噪声向量中随机抽取的(无需替换)并分配给图片。该向量包括一个噪声分布(每个类别 210 个条目),它包括以 0.5% 为步长的介于 5% 和 98% 之间的所有可能值,但会跳过其中一些值并包括最多 3 次的其他一些值(对问题 3 的回答)。这确保了每个参与者都体验到相同的噪声级别(尽管对于相同的图片不太可能,因为噪声级别在实验开始时随机分配给各个图片)并且在整个范围内都有很好的覆盖,但焦点噪音水平接近阈值(对于我们的设置)参与者可以在大约 50% 的时间内识别图片。这个阈值是在一项初步研究中发现的,其他参与者使用了在黑色背景上呈现的相同图片。因此,黑色背景是本实验的默认背景。

3.两张或多张图片是否有可能呈现相同级别的噪点?是的,这会发生多次,最多包含 3 张相同噪点的单独图片,但不超过 3 张。

4.您能否确认您对噪音与响应的关联不感兴趣?这个问题对我来说很难回答。如果图片更难看到,即存在更多噪声,则可以预期不同背景的效果(如果有的话)最为突出。所以我想在分析中考虑噪声,但我不一定要求分析告诉我关于噪声与响应的关联的任何信息。我只对尽可能多地检测背景条件之间的任何差异感兴趣。起初,我想为 3 种不同背景条件中的每一种拟合 2 条心理测量曲线(相应类别与噪声水平的响应概率),然后比较心理测量拟合的变化以检查背景条件的差异。然而,自举分析表明,拟合过程的方差太大,无法检测到我期望的范围内的变化。因此,我假设有关噪声与响应关联的信息也可能会降低其他类型分析的能力。如果是这种情况,我不需要它。

5.你所说的“感知”和“两者”是什么意思。你真正想知道什么?我所说的“对[类别]的看法”不是指正确百分比,而是“[类别]反应”。我的假设(我想测试一下)是面部背景会影响参与者以面部回应 对象背景不会影响参与者以对象回应(作为读者,这个假设可能对您没有任何意义,但这是我需要测试的)。我对“两者”的意思是,如果面部背景影响参与者以面部响应并且对象背景影响参与者以对象响应的情况,我假设只有面部背景有效果关于感知将是错误的。包括不同的噪声水平,因为当图片更难看到/识别时,影响对某一类别的感知的机会应该更大。因此,如果对任何类别的感知存在依赖于背景的影响,则不太可能在例如 5% - 20% 的噪声范围内显示,而是在较高的噪声范围内显示。

如果您需要更多信息,请告诉我。

2个回答

第一的:

“请记住,所有模型都是错误的;实际的问题是它们必须错到什么程度才能无用。”

盒子,GEP;Draper, NR (1987),经验模型构建和响应曲面,John Wiley & Sons。

因此,没有一种也是唯一一种对数据建模的正确方法。

研究问题广泛地询问背景类型与类别感知的关联,但是有两个不同的问题:

  1. 背景=3(人脸)是否与响应=0(人脸)相关(研究假设:是)
  2. 背景=2(对象)是否与响应=1(对象)相关(研究假设:否)

您的设置是阶乘。您正在改变因子 (和) 的水平Category并测量这些因子的不同组合的响应。您特别感兴趣的是背景(3 级因子)与响应(二元变量)的关联,因此逻辑回归分析似乎可以回答这些问题。NoiseBackground

  • 估计background=2回答了这个问题:当背景是物体时,与背景是黑色时相比,物体响应的对数几率有什么区别。这回答了研究问题 2。为了与研究假设一致,这个估计值应该很小和/或没有统计学意义。
  • 估计background=3回答了这个问题:当背景是人脸时,与背景是黑色时相比,响应对象的对数几率有什么区别。因此,这个估计负值是当背景是脸时,与背景是黑色时相比,用脸响应的对数几率的差异。这回答了研究问题 1。为了与研究假设一致,这个估计值应该很小和/或没有统计学意义。

然而,这并不是故事的结局......

显然,您对参与者进行了重复测量,这需要加以控制,因为一个参与者的反应将更像同一参与者的其他反应,而不是其他参与者的反应(也就是说,内部测量可能存在相关性每个参与者)。这可以通过包含随机截距Participant或包含Participant为固定效果来控制。5 被许多人认为是用作随机效应的因子的最小级别数,并且由于您打算在研究中添加更多参与者,因此这是我的建议。任何一种方法都可以控制重复测量,因此您可以运行这两个模型,我将在下面介绍这两个模型。

您还对每张图片进行了重复测量,每张图片测量 3 次。因此,每张图片内也可能存在相关性。由于您有 420 张不同的图片,因此将图片作为固定效果进行控制并不是一个好主意,因此随机截取是合适的。因此,我的起始模型将是一个混合效应模型,其中 和 具有随机截距,具有Picture_ID固定Participant效应(噪声被编码为数字)。参与者不嵌套在图片内,而图片也不嵌套在参与者内所以这些都是交叉随机效应。CategoryBackgroundNoise

R使用lme4包时,这将被指定为:

glmer(Response ~ Category + Background + Noise + (1|Participant) + (1|Picture_ID), data=dt, family=binomial(link=logit))

由于参与者人数较少,另一种模式是:

glmer(Response ~ Category + Background + Noise + Participant + (1|Picture_ID), data=dt, family=binomial(link=logit))

可以扩展分析以允许:

  • 固定效应之间的相互作用

  • 响应和噪声之间的非线性关联(通过包括噪声的二次项和可能的更高阶项)

  • 噪声的关联在参与者和/或图片之间变化(通过包括噪声的随机系数)

以上是基于所需背景与黑色背景的对比——即face vs blackobject vs black如果需要人脸与对象,可以通过重新编码因子或直接指定参考水平来处理。如果需要面部与非面部对象与非对象,则可以通过创建虚拟变量轻松完成。

我相信条件逻辑回归会给你想要的结果。

在分析此数据时,您正确地确定了使用重复测量约定的需要。您有 5 名受访者评估了在多种条件下正确/不正确的人脸/物体识别的二元结果。一个人的众多回应产生了对重复测量方法的需求。

如果您的意图实际上更好地表述为受访者选择面部还是对象,您可以使用相同的分析方法,但请注意,您将解释受访者的选择不正确/不正确的分类。对于第三类“两者”,您需要多项逻辑回归。我假设您对以下内容的正确/不正确分类感兴趣。

你说“因为每个参与者都是在所有 3 个背景条件下测量的,所以它是一个依赖设计。因为对于一张单独的图片,我在 3 个背景条件下保持噪声不变,它以某种方式配对或匹配。” 评估中的条件虽然在价值或质量方面受到限制,但不会“调节”您的分析。使用灰色背景、具有 45% 噪声的面部图片只是记录响应时出现的协变量向量之一。灰色背景、物体、45% 噪声是另一个向量,而白色、人脸、10% 噪声是另一个向量。回归将向您建议背景(虚拟编码)、噪声或其他变量是否与正确响应相关联。正确识别与任何一个值的变化之间的关联,保持所有其他值不变,是多元回归的解释。因此,您将了解背景或噪声中的一个单位差异或是否使用条件逻辑回归显示人脸/对象之间的关联。

您在 R 中的模型将类似于:

install.packages("survival")
require("survival")
clogit(correct ~ background + noise + pic_type + strata(person), data)

可以考虑为图片中的每个特定面部或对象建立一个更复杂的模型,但您会削弱检测所需背景效果的能力。