我对使用 AIC 进行模型选择有疑问——在这种情况下,它可能不会推荐真正的最佳预测模型(根据我的理解)。我了解 AIC 有 2 个术语 - 拟合优度(可以从我在模型训练数据集上的发现错误中获得)和复杂度术语(模型中参数的 2*no.)。我在下面讨论这个案例:
我有 2 个模型 - 第一个模型是插值每个数据点和过拟合的非参数模型,因此没有。参数 (K) 与样本大小相同(假设为 500)。训练集上的 SSE(拟合优度)非常好,比如 1e-4(因为它过拟合了训练数据集)。其计算的 AIC 值(使用公式 n*ln(SSE/n)+2K)将为 -6712。第二个模型是具有 6 个参数的参数模型(二阶多项式回归模型)。它的拟合优度不如 SSE 为 1e-1 的非参数模型。其计算出的 AIC 为 -4246。
基于 delta(AIC),我们将选择模型 1,但我们知道第一个模型过拟合数据,因此不能很好地概括新数据。
因此,当模型过度拟合数据但复杂性项并没有很好地惩罚它以拒绝它时,我们如何在这种情况下使用 AIC。这种情况是否意味着我们不能使用 AIC 来区分参数模型和非参数模型?