是什么破坏了模型与 AIC 的可比性?

机器算法验证 aic
2022-03-22 04:00:47

假设我已经使用来自同一数据集的预测变量(和响应变量)拟合了一些模型。

模型的哪些变化会让我在 AIC 的基础上比较模型变得不合理?

1)假设,如果我对因变量进行日志转换,将其与没有转换的模型进行比较是否公平?

2)如果我要从模型中删除预测变量,我可以将它与添加了所有预测变量的模型进行比较吗?

3)如果我将两个不同家庭的glms分别安装在两者上,我还能在AIC的基础上进行比较吗?不同的链接功能呢?

谢谢您的意见。

1个回答

如果你有两个模型M1M2样品(y1,,yn),那么只要模型合理,就可以使用 AIC 进行比较。当然,这并不意味着 AIC 会在竞争对手中选择最接近真相的模型,因为 AIC 是基于渐近结果的。在一个极端的场景下,假设你要比较两个模型,一个有 1 个单参数,另一个有 100 个参数,样本量为101. 然后,预计在具有 100 个参数的模型的估计中会观察到非常低的精度,而在具有 1 个参数的模型中,可能会准确估计参数。这是反对使用 AIC 来比较似然估计器具有非常不同收敛速度的模型的论据之一。即使在具有相同数量参数的模型中也可能发生这种情况。

  1. 是的,只要模型仍然有意义,您就可以使用 AIC 来比较您在其中一个模型中转换响应变量的两个模型然而,这并非总是如此。如果你有一个线性模型

yi=xiTβ+ei,
在哪里eiN(0,σ),这意味着变量yi可以取任何实际值。因此,从理论的角度来看,对数变换没有意义,即使样本只包含正值。

  1. 这称为逐步 AIC 变量选择。已经在 R 命令中实现stepAIC()

  2. 同样,只要用这种模型对数据进行建模是有意义的。

关于 AIC 使用的一些有趣的讨论可以在这里找到:

AIC 神话和误解