在大学里,我们为两级嵌套数据计算了一个随机截距模型。我们将具有所有 1 级变量的随机截距模型与具有所有 1 级和所有 2 级变量的随机截距模型进行了比较。像这样,我们得到了 1 级变量的主效应和 2 级变量的主效应。但是我们没有运行模型来查看是否也存在随机斜率。(在另一个步骤中,我们甚至在模型中包含了一个级别 1 和级别 2 变量之间的交互项,这很重要。但这之前仍然没有测试随机斜率)。
现在我想知道是否不应该总是测试随机斜率?如果实际上随机斜率模型比随机截距模型更适合数据会发生什么?这是否意味着未正确估计随机截距模型中的系数?
可以在不测试随机斜率的情况下使用随机截距模型吗?
机器算法验证
多层次分析
2022-04-15 07:30:05
2个回答
具有混合效应的模型具有 2 个随机成分:
残留误差
随机效应
如果您使用随机斜率并注意到模型表现更好,这意味着存在残差、随机截距和固定效应未正确捕获的变异性。您可以采取的另一个方向是灵活处理残差(例如,使用 Student-t 而不是残差的正态分布)。现在的问题是:哪个模型表现更好?那个有正常错误还是有 Student-t 错误?具有随机斜率和正常误差的那个?具有随机斜率和 Student-t 误差的那个?... 等等。如果你能实现所有这些并比较它们,你就可以了解数据的特征。例如,如果您的模型选择偏爱具有 Student-t 误差且没有随机斜率的模型,
我会呼应@East 对模型探索的倡导,但已经很好地说明了这一点。根据 Barr 等人(2013 年;以下完整引用),如果存在随机斜率,则无法拟合可能会导致 I 型错误率升高(当原假设实际为真时,错误拒绝原假设)。因此,(据我了解)如果随机斜率模型比随机截距模型更适合数据,则固定效应误差将有被低估的趋势。在实践中(再次,据我了解),固定效应系数将被合理地估计,但误差将被错误地估计(偏向较低幅度)。
Barr, DJ, Levy, R., Scheepers, C., & Tily, HJ (2013)。验证性假设检验的随机效应结构:保持最大。记忆和语言杂志,68(3),255-278。
其它你可能感兴趣的问题