这个问题/话题是在与一位同事的讨论中提出的,我正在寻找一些关于此的意见:
我正在使用随机效应逻辑回归对一些数据进行建模,更准确地说是随机截距逻辑回归。对于固定效应,我有 9 个变量值得考虑并加以考虑。我想做某种模型选择以找到重要的变量并给出“最佳”模型(仅限主效应)。
我的第一个想法是使用 AIC 来比较不同的模型,但是使用 9 个变量比较 2^9=512 个不同的模型(关键词:数据挖掘)并不太令人兴奋。
我与一位同事讨论过这个问题,他告诉我他记得读过关于使用 GLMM 进行逐步(或前向)模型选择的文章。但是,不应使用 p 值(例如,基于 GLMM 的似然比检验),而应使用 AIC 作为进入/退出标准。
我发现这个想法很有趣,但我没有找到任何进一步讨论这个问题的参考资料,而且我的同事也不记得他在哪里读到的。许多书籍建议使用 AIC 来比较模型,但我没有找到任何关于将它与逐步或前向模型选择过程一起使用的讨论。
所以我基本上有两个问题:
在逐步模型选择过程中使用 AIC 作为进入/退出标准有什么问题吗?如果是,有什么替代方案?
您是否有一些讨论上述程序的参考资料(也作为最终报告的参考资料?
最好的,
艾米利亚