混合效应纵向数据需要多少数据点?

机器算法验证 r 混合模式 面板数据
2022-03-23 13:10:56

我正在使用 4 个时间波收集纵向数据。尽管该调查是针对同一人群进行的,但不同的个人可能会决定在每个时间点完成它。因此,有些人只完成了一次,有些人完成了两次,有些人完成了三遍,还有一些人参加了所有四波。例如,目前时间 1 大约有 2000 名参与者,时间 2 大约有 1900 人,但只有 1200 人同时参与时间 1 和时间 2(目前我仍在收集时间 3 的数据,所以我还不知道是什么最终匹配的样本将是)。

数据来自不同的组织,所以我想用 R 中的 lmer 使用混合效果来建模。例如

lmer(outcome~"some repeated variables"+"organization level variables"+timewave+(timewave|subject)+(1|organizations))

我的问题是

  • 我是否需要删除仅完成一次或两次的个人以使用随机斜率时间?
  • 考虑到只有 4 个波浪,尝试拟合时间的二次效应是否有意义?(我是否需要删除未参加所有四项的科目?)
  • 非常感谢,

    乔治

    1个回答
    • ,您不需要删除仅具有一个(或仅有限数量)时间点数据的个人。你认为只有一个时间点的个体对斜率的估计没有任何贡献,但他们对截距的估计有贡献,你想同时估计两者是正确的。数学和算法处理这个问题,所以你不必担心,如果你试图通过放弃你认为不会的观察来猜测事情,你比 lmer 的程序员更有可能犯错误贡献。

    • 的,您可以用 4 个时间点拟合时间的二次效应。事实上,如果你设计了一个实验来寻找二次效应,你可能会选择有 4 个时间点。(原则上 3 会最大化你的能力,但 4 允许 1 df 来测试二次曲线的拟合)。显然,您至少需要一些人参与至少 3 波。但如上所述,不要删除没有删除的主题。