具有非独立观测值的方差分析

机器算法验证 方差分析
2022-02-28 03:51:29

很抱歉这个问题的详细背景:

有时,在动物行为的调查中,实验者会对受试者在测试设备中不同的预定义区域中花费的时间感兴趣。我经常看到使用 ANOVA 分析此类数据;但是,我从未完全相信此类分析的有效性,因为 ANOVA 假设观察结果是独立的,并且它们在这些分析中实际上从未独立(因为在一个区域花费的时间越多,在其他区域花费的时间越少! )。

例如,

史密斯博士,CD Striplin,AM Geller,RB Mailman,J. Drago,CP Lawler,M. Gallagher,缺乏 D1A 多巴胺受体的小鼠的行为评估,神经科学,第 86 卷,第 1 期,1998 年 5 月 21 日,第 135-146 页

在上面的文章中,他们将自由度降低了 1 以补偿非独立性。但是,我不确定这种操纵如何真正改善这种违反 ANOVA 假设的情况。

也许卡方程序可能更合适?你会如何分析这样的数据(对区域的偏好,基于在区域中花费的时间)?

谢谢!

4个回答

麦克风,

我同意基于总时间的方差分析在这里可能不是正确的方法。此外,我不相信 Chi Sqaure 可以解决您的问题。卡方将尊重您不能同时在两个位置的想法,但它没有解决时间 N 和时间 N+1 之间可能存在依赖关系的问题。关于第二个问题,我看到您的情况与人们使用眼睛和鼠标跟踪数据遇到的情况之间存在一些类比。某种多项式模型可以很好地满足您的目的。不幸的是,这种模型的细节超出了我的专业范围。我敢肯定,某处的某些统计书籍对此主题有很好的入门知识,但我想我会向您指出:

  • Barr DJ (2008) 使用多级逻辑回归分析“视觉世界”眼动追踪数据。记忆与语言杂志,特刊:新兴数据分析 (59) pp 457-474
  • https://r-forge.r-project.org/projects/gmpm/是 Barr 博士针对同一问题开发的一种非参数方法

如果有的话,这两个来源都应该非常完整,因为它们涉及如何分析职位的时间进程。

查看具有空间相关误差(和空间相关协变量)的模型。此处提供了简要介绍以及GeoDa参考资料。有很多文字;好的是Noel CressieRobert HainingFotheringham 等人的(最后一个链接指向摘要,而不是书籍网站)。最近出现了一些 R 代码,但我不熟悉它。

(注意事项:我不是这方面的专家)

如果您只想讨论每个位置花费的时间差异,那么将“每个位置的时间”数据提交为多项混合模型中的计数(请参阅 R 的 MCMCglmm 包),使用主题作为随机效应,应该做诀窍。

如果您想谈论位置偏好随时间的差异那么也许将时间划分为合理的间隔(可能是您的计时设备的分辨率?),根据当时鼠标的位置对每个间隔进行分类(例如,如果 3 个位置,每个区间都被标记为 1、2 或 3),并再次使用多项混合效应模型,将主题作为随机效应,但这次添加区间作为固定效应(尽管可能仅在分解区间之后,这会降低功率但应该有所帮助通过时间捕捉非线性)。

我将提出一个与传统 ANOVA 截然不同的答案。令 T 为动物可在所有区域度过的总时间。您可以将 T 定义为清醒时间的总量等。假设您有 J 个区域。然后根据定义,您有:

总和 T_j = T

您可以通过将 lhs 和 rhs 除以 T 来规范化上述内容,您会得到

总和 P_j = 1

其中 P_j 是动物在 j 区停留的时间比例。

现在您的问题是,对于所有 j,P_j 是否与 1 / J 显着不同。

您可以假设 P_j 遵循狄利克雷分布并估计两个模型。

空模型

设置分布参数,使得 P_j = 1 / J。(将分布参数设置为 1 即可。)

替代模型

将分布参数设置为区域特定协变量的函数。然后,您可以估计模型参数。

如果它在某些标准(例如,似然比)上优于空模型,您将选择替代模型。