如何确定混合模型中的随机效应

机器算法验证 混合模式 特征选择 模型选择
2022-03-26 12:06:53

我想根据几个人口因素可能预测的几年内按州对社会影响的频率进行建模。我一直在阅读,应该在尝试确定固定效应结构之前确定随机效应结构。我要确保测试固定效果的一件事是每个固定效果与时间的相互作用。

我是否只想拥有拦截|状态,或者我是否也想查看每个状态的每个可能的固定因子的斜率。如果我还没有建立模型的固定效应部分,我将如何做后者?我还会将每个潜在固定效应的固定:时间视为随机效应吗?

我想避免疏浚。每个变量我只有 459 分(9 年,50 个州 + DC)。但是,我还希望能够将完整模型的模型预测与仅具有固定效应的模型进行对比。

2个回答

您可以通过对仅使用随机截距的一个模型和使用随机斜率和截距的另一个模型进行建模来测试斜率的方差(以及斜率和截距之间的协方差)是否显着然后您可以在两者之间进行嵌套模型比较:

mod1 <- lmer(... + (1|state), ...)
mod2 <- lmer(... + (1+predictor|state), ...)
anova(mod1,mod2)

不过,这将为您提供需要更正的 p 值。您可以使用以下代码执行此操作:

1-(.5*pchisq(anova(mod1,mod2, refit=FALSE)$Chisq[[2]],df=2)+
   .5*pchisq(anova(mod1,mod2, refit=FALSE)$Chisq[[2]],df=1))

P 值校正可在此处此处找到。

用于描述相关数据中相关结构的探索性分析包括用于连续时空数据的变异函数、用于聚类数据的类内相关系数、用于二元结果的 lorelograms。

其他描述性统计包括随机效应模型中方差分量的自举或轮廓似然置信区间、具有非结构化协方差结构的拟合优度检验或随机和固定效应的饱和规范。

可以通过使用似然比检验测试嵌套模型来对具有 0 离散度的随机效应假设进行正式推断。在进行这些测试时,请务必更改软件设置以适应具有最大可能性的模型而不是 REML。