我有一个实验的数据,其中每个参与者对每个呈现的刺激都提供二元响应,这是正确的 (1) 或不正确的 (0)。
有 4 种不同的刺激类型,每组 48 种刺激呈现给每个参与者。我想比较刺激类型对(所有参与者)之间实现的准确性。
显而易见的事情是汇总每个参与者在每个刺激组内的反应,以获得用于重复测量 ANOVA 的准确度分数。
但是,令我感到困扰的是,这忽略了计算该准确度得分的试验次数——无论每个准确度得分是基于 48 个二进制响应还是 400 个二进制响应,显着性测试都会产生相同的重要性!那么,另一种选择是使用原始二进制数据,但数据不再独立,因此卡方检验是不可能的。我模糊地意识到逻辑回归或广义估计方程(gee)可以解决这个问题,但我只看到它们与较小的相关数据集群一起使用。
在这里做什么是正确的?