给定以下实验,回答以下问题的正确统计方法是什么:
参与者连续显示图片,并要求在每张图片后回答她是否看到了物体或脸。在每次试验(图片展示)中,展示的图片(210 个单独的人脸中的 1 个或 210 个单独的对象中的 1 个)叠加一定量的随机噪声(在 5% 和 98% 之间)。每个试验中呈现的图片都比较小,因此每个试验也有一个背景。背景可以是黑色、大物体或大脸。单张图片匹配,即每张单张图片共呈现3次,黑色背景1次,大物体背景1次,大脸背景1次。叠加在单个图片上的随机噪声量在 3 种不同的背景条件下保持不变。大物体背景中的物体没有变化,也不包含在所呈现的 210 个单独的物体图片之一中。同样,大人脸背景中的人脸也没有变化,也没有包含在所呈现的 210 张个人人脸图片中的一张中。没有噪音被添加到任何背景中。
我想回答的问题是,在 3 种不同的背景条件下,对面部、物体或两者的感知是否存在显着差异。 有关我想回答的问题的更多详细信息,请参阅下面的问题 5
所以最后,我有一个数据表,如下所示:
+-------------+-------------+--------------+------- ------+--------------+--------------+ | 参与者 | 类别 | 图片ID | 噪音水平 | 背景 | 回应* | +-------------+-------------+--------------+------- ------+--------------+--------------+ | 1 | 0 | 1 | 5% | 1 | 0 | | 1 | 0 | 1 | 5% | 2 | 0 | | 1 | 0 | 1 | 5% | 3 | 0 | | | | | | | | | 1 | 0 | 2 | 24% | 1 | 0 | | 1 | 0 | 2 | 24% | 2 | 1 | | 1 | 0 | 2 | 24% | 3 | 0 | | | | | | | | | 1 | 0 | 3 | 80% | 1 | 1 | | 1 | 0 | 3 | 80% | 2 | 0 | | 1 | 0 | 3 | 80% | 3 | 1 | | | | | | | | | .. | .. | .. | .. | .. | .. | +-------------+-------------+--------------+------- ------+--------------+--------------+ | 1 | 1 | 211 | 12% | 1 | 1 | | 1 | 1 | 211 | 12% | 2 | 1 | | 1 | 1 | 211 | 12% | 3 | 1 | | | | | | | | | 1 | 1 | 212 | 20% | 1 | 1 | | 1 | 1 | 212 | 20% | 2 | 0 | | 1 | 1 | 212 | 20% | 3 | 1 | | | | | | | | | 1 | 1 | 213 | 75% | 1 | 0 | | 1 | 1 | 213 | 75% | 2 | 0 | | 1 | 1 | 213 | 75% | 3 | 1 | | | | | | | | | .. | .. | .. | .. | .. | .. | +-------------+-------------+--------------+------- ------+--------------+--------------+
其中类别是面 (0) 或对象 (1),响应也是面 (0) 或对象 (1)。参与者的反应是因变量。具有基本连续体的二分法。由于每个参与者都在所有 3 个背景条件下进行测量,因此它是一个依赖设计。因为,对于一张单独的图片,我在 3 个背景条件下保持噪声不变,它以某种方式配对或匹配。
首先,我考虑计算双列相关性并根据 t 统计量比较它们,但后来我看到逻辑回归似乎更适合我的数据结构。但我还是觉得应该以某种方式将匹配样本和依赖设计纳入分析。所以当我搜索它时,会弹出条件逻辑回归。
问题是,在条件逻辑回归中,匹配是在因变量上完成的。它们通常将因变量中的 1 与一个或多个 0 样本相匹配。我没有匹配因变量,而是匹配自变量(在每个背景条件下具有相同噪声水平的相同图片)。所以我认为我不能对这些数据使用条件逻辑回归,但我找不到其他合适的东西。
有更多统计经验的人可以向我解释回答上述问题的正确方法是什么,无论是对面部、物体还是两者的感知在 3 种不同背景条件之间是否存在显着差异。
谢谢您的帮助。
[实验过程]
该实验共有 1260 次试验。由 210 个单独的面孔和 210 个单独的对象组成,每个对象呈现 3 次(3 种不同背景中的每一种都出现一次)。试验顺序是随机的,其约束条件是在 420 次试验的第一个、第二个和最后一个块中,每个背景恰好呈现 140 次,每个单独的对象和每个单独的面孔只呈现一次。大多数但不是所有不同的人脸和对象都添加了不同数量的噪声,但单个人脸或对象的噪声在其呈现的 3 种不同背景条件下保持不变。
[问题和答案]
1.有多少参与者?共有5名参与者。
2.噪音有界限吗?噪声以 0.5% 的步长在 [5%, 98%] 范围内离散化。噪声是从噪声向量中随机抽取的(无需替换)并分配给图片。该向量包括一个噪声分布(每个类别 210 个条目),它不包括以 0.5% 为步长的介于 5% 和 98% 之间的所有可能值,但会跳过其中一些值并包括最多 3 次的其他一些值(对问题 3 的回答)。这确保了每个参与者都体验到相同的噪声级别(尽管对于相同的图片不太可能,因为噪声级别在实验开始时随机分配给各个图片)并且在整个范围内都有很好的覆盖,但焦点噪音水平接近阈值(对于我们的设置)参与者可以在大约 50% 的时间内识别图片。这个阈值是在一项初步研究中发现的,其他参与者使用了在黑色背景上呈现的相同图片。因此,黑色背景是本实验的默认背景。
3.两张或多张图片是否有可能呈现相同级别的噪点?是的,这会发生多次,最多包含 3 张相同噪点的单独图片,但不超过 3 张。
4.您能否确认您对噪音与响应的关联不感兴趣?这个问题对我来说很难回答。如果图片更难看到,即存在更多噪声,则可以预期不同背景的效果(如果有的话)最为突出。所以我想在分析中考虑噪声,但我不一定要求分析告诉我关于噪声与响应的关联的任何信息。我只对尽可能多地检测背景条件之间的任何差异感兴趣。起初,我想为 3 种不同背景条件中的每一种拟合 2 条心理测量曲线(相应类别与噪声水平的响应概率),然后比较心理测量拟合的变化以检查背景条件的差异。然而,自举分析表明,拟合过程的方差太大,无法检测到我期望的范围内的变化。因此,我假设有关噪声与响应关联的信息也可能会降低其他类型分析的能力。如果是这种情况,我不需要它。
5.你所说的“感知”和“两者”是什么意思。你真正想知道什么?我所说的“对[类别]的看法”不是指正确百分比,而是“[类别]反应”。我的假设(我想测试一下)是面部背景会影响参与者以面部回应 但对象背景不会影响参与者以对象回应(作为读者,这个假设可能对您没有任何意义,但这是我需要测试的)。我对“两者”的意思是,如果面部背景影响参与者以面部响应并且对象背景影响参与者以对象响应的情况,我假设只有面部背景有效果关于感知将是错误的。包括不同的噪声水平,因为当图片更难看到/识别时,影响对某一类别的感知的机会应该更大。因此,如果对任何类别的感知存在依赖于背景的影响,则不太可能在例如 5% - 20% 的噪声范围内显示,而是在较高的噪声范围内显示。
如果您需要更多信息,请告诉我。