应该如何比较和/或验证混合效应模型?

机器算法验证 假设检验 混合模式 交叉验证 aic 自由程度
2022-02-12 17:38:13

(线性)混合效应模型通常如何相互比较?我知道可以使用似然比检验,但是如果一个模型不是另一个模型的“子集”,这不起作用吗?

模型 df 的估计总是简单的吗?固定效应的数量+估计的方差分量的数量?我们是否忽略了随机效应估计?

验证呢?我的第一个想法是交叉验证,但考虑到数据的结构,随机折叠可能不起作用。“留下一个主题/集群”的方法是否合适?留下一个观察结果怎么样?

Mallows Cp 可以解释为模型预测误差的估计。通过 AIC 选择模型试图最小化预测误差(所以如果误差是高斯的,我相信 Cp 和 AIC 应该选择相同的模型)。这是否意味着 AIC 或 Cp 可用于根据预测误差从一些非嵌套模型的集合中选择“最佳”线性混合效应模型?(如果它们适合相同的数据) BIC 是否仍然更有可能在候选人中选择“真实”模型?

我的印象也是,当通过 AIC 或 BIC 比较混合效应模型时,我们只将固定效应计算为计算中的“参数”,而不是实际模型 df。

有没有关于这些主题的好文献?是否值得研究 cAIC 或 mAIC?它们在 AIC 之外是否有特定应用?

2个回答

混合模型中模型选择的主要问题是真正定义模型的自由度(df)。要计算混合模型的 df,必须定义估计参数的数量,包括固定效应和随机效应。这并不简单。Jiming Jiang 等人 (2008) 的这篇题为“Fence methods for mixed model selection”的论文可以应用于这种情况。一项新的相关工作是Greven , S. & Kneib, T. (2010) 的题为“关于线性混合模型中边际和条件 AIC 的行为”的工作。希望这会有所帮助。

比较模型(无论是混合模型还是其他模型)的一种方法是绘制结果。假设您有模型 A 和模型 B;从每个生成拟合值并在散点图中将它们相互绘制。如果值非常相似(根据您的判断是否相似),请选择更简单的模型。另一个想法是找到拟合值之间的差异并将它们与独立值作图;您还可以制作差异的密度图。总的来说,我支持使用统计测试来比较模型(尽管 AIC 及其变体肯定有优点),而是使用判断。当然,这具有不给出精确答案的(不利)优势。