使用线性混合效应模型有哪些主要缺陷?在评估模型的适当性时,需要测试/注意的最重要的事情是什么?在比较同一数据集的模型时,最重要的是要寻找什么?
线性混合模型的陷阱
这是一个很好的问题。
以下是一些常见的陷阱:
使用标准似然理论,我们可以推导出一个检验来比较两个嵌套假设,和,通过计算似然比检验统计量。该检验统计量的零分布近似为卡方,其自由度等于两个参数空间维度的差异。不幸的是,这个测试只是近似的,需要几个假设。一个关键的假设是空值下的参数不在参数空间的边界上。因为我们经常有兴趣测试关于采取以下形式的随机效应的假设:
这是一个真正的担忧。解决这个问题的方法是使用 REML。但是,p 值往往会比应有的更大。这意味着,如果您使用 χ2 近似值观察到显着效应,您可以相当确信它实际上是显着的。小但不显着的 p 值可能会促使人们使用更准确但更耗时的引导方法。比较固定效应:如果您打算使用似然比检验来比较两个仅在固定效应上有所不同的嵌套模型,则不能使用 REML 估计方法。原因是 REML 通过考虑消除固定效应的数据的线性组合来估计随机效应。如果这些固定效应发生变化,两个模型的可能性将无法直接比较。
P 值:固定效应的似然比检验生成的 p 值是近似值,不幸的是往往太小,因此有时夸大了某些效应的重要性。我们可以使用非参数引导方法为似然比检验找到更准确的 p 值。
Doug Bates 博士[此处]强调了关于固定效应检验的 p 值的其他问题。
我相信论坛的其他成员会有更好的答案。
资料来源:用 R 扩展线性模型——Julain Faraway 博士。
我看到的常见陷阱是忽略随机效应的方差。如果它与残差方差或因变量的方差相比很大,则拟合通常看起来不错,但这只是因为随机效应解释了所有方差。但是由于实际与预测的图表看起来不错,您倾向于认为您的模型是好的。
当这种模型用于预测新数据时,一切都崩溃了。通常,您只能使用固定效果,并且拟合可能非常差。
对方差结构进行建模可以说是混合模型中最强大和最重要的单一特征。这超出了方差结构,包括观察之间的相关性。必须注意建立适当的协方差结构,否则假设检验、置信区间和治疗均值估计可能无效。通常需要了解实验的知识来指定正确的随机效应。
SAS for Mixed Models 是我的首选资源,即使我想在 R 中进行分析。