假设我已经使用来自同一数据集的预测变量(和响应变量)拟合了一些模型。
模型的哪些变化会让我在 AIC 的基础上比较模型变得不合理?
1)假设,如果我对因变量进行日志转换,将其与没有转换的模型进行比较是否公平?
2)如果我要从模型中删除预测变量,我可以将它与添加了所有预测变量的模型进行比较吗?
3)如果我将两个不同家庭的glms分别安装在两者上,我还能在AIC的基础上进行比较吗?不同的链接功能呢?
谢谢您的意见。
假设我已经使用来自同一数据集的预测变量(和响应变量)拟合了一些模型。
模型的哪些变化会让我在 AIC 的基础上比较模型变得不合理?
1)假设,如果我对因变量进行日志转换,将其与没有转换的模型进行比较是否公平?
2)如果我要从模型中删除预测变量,我可以将它与添加了所有预测变量的模型进行比较吗?
3)如果我将两个不同家庭的glms分别安装在两者上,我还能在AIC的基础上进行比较吗?不同的链接功能呢?
谢谢您的意见。
如果你有两个模型和样品,那么只要模型合理,就可以使用 AIC 进行比较。当然,这并不意味着 AIC 会在竞争对手中选择最接近真相的模型,因为 AIC 是基于渐近结果的。在一个极端的场景下,假设你要比较两个模型,一个有 1 个单参数,另一个有 100 个参数,样本量为. 然后,预计在具有 100 个参数的模型的估计中会观察到非常低的精度,而在具有 1 个参数的模型中,可能会准确估计参数。这是反对使用 AIC 来比较似然估计器具有非常不同收敛速度的模型的论据之一。即使在具有相同数量参数的模型中也可能发生这种情况。
这称为逐步 AIC 变量选择。已经在 R 命令中实现stepAIC()
。
同样,只要用这种模型对数据进行建模是有意义的。
关于 AIC 使用的一些有趣的讨论可以在这里找到: