比较不同数据集的AIC差异

机器算法验证 aic
2022-04-14 11:16:57

假设我们有两个线性回归模型m1m2, 在哪里m2嵌套在m1, 和两个数据集d1d2它们的大小不同。

计算每对的 AIC 表明以下等式成立:

AICm2,d1AICm1,d1>AICm2,d2AICm1,d2

我们可以从这个等式中得出结论,非嵌套/完整模型m1“改善”m2关于数据d1超过数据集d2?

该结论可能无效,因为 AIC 值是根据不同的数据集计算的,因此可能不具有可比性。但是,由于实际上比较了 AIC 差异,因此该结论可能是有效的。你对此有什么看法?

1个回答

AIC 标准与数据集的整体大小成比例,对于 AIC 值的差异也是如此。标准基于关系

2E[logPrθ^(Y)]2NE[loglik]+2dN
在哪里d是被最大化的似然函数中的参数数量(统计学习方程 7.27 的元素)。左边的术语是预期的样本外“错误”率,使用概率的对数作为错误度量。右手包括根据最大化对数似然估计的样本内错误率,加上项2d/N校正最大化对数似然的乐观。这里最重要的因素是N在右手边的分母中。AIC 通常定义为
AIC=2loglik+2d
(虽然 ESL 教科书增加了一个1/N因素)。在这种形式下,AIC 预测N乘以样本外错误率。要比较两个样本的 AIC 差异,您应该将 AIC 值除以样本大小,以便在相等条件下比较它们。